Перетворення тексту в таблицю


1

Я хотів би перетворити текст на таблицю. Ось посилання на текст

http://www.tcdb.org/public/tcdb

Короткий приклад:

>gnl|TC-DB|A0CIB0|1.A.17.3.1 Chromosome undetermined scaffold_19, whole genome shotgun sequence OS=Paramecium tetraurelia GN=GSPATT00007662001 PE=4 SV=1
MDDQNQPILQEQPKPKQKKPLLNTKMVKKQKMQNKKEENLREILNFYTNQVDARKFLQKM
KAVVDSNQQEKKYQDDFLNPNEYNEMQDIYEDYNMGDLVIVFPNPDADGVKNPPITYKEA
PLTKTNFYSKIGNVSYENDIDELCVDEMEYLRNMRNVDGEHMDQDHVKEEI
>gnl|TC-DB|A0CS82|9.B.82.1.5 Chromosome undetermined scaffold_26, whole genome shotgun sequence - Paramecium tetraurelia.
MIIEEQIEEKMIYKAIHRVKVNYQKKIDRYILYKKSRWFFNLLLMLLYAYRIQNIGGFYI
VTYIYCVYQLQLLIDYFTPLGLPPVNLEDEEEDDDQFQNDFSELPTTLSNKNELNDKEFR
PLLRTTSEFKVWQKSVFSVIFAYFCTYIPIWDIPVYWPFLFCYFFVIVGMSIRKYIKHMK
KYGYTILDFTKKK

Я хотів, щоб колонки, наприклад, були розділені з трубою | або ;

|>gnl|TC-DB|A0CIB0|1.A.17.3.1| Chromosome undetermined scaffold_19, whole genome shotgun sequence OS=Paramecium tetraurelia GN=GSPATT00007662001 PE=4 SV=1|
MDDQNQPILQEQPKPKQKKPLLNTKMVKKQKMQNKKEENLREILNFYTNQVDARKFLQKM
KAVVDSNQQEKKYQDDFLNPNEYNEMQDIYEDYNMGDLVIVFPNPDADGVKNPPITYKEA
PLTKTNFYSKIGNVSYENDIDELCVDEMEYLRNMRNVDGEHMDQDHVKEEI

Я працюю з Windows, і я не знаю, як це зробити

Я просто знаю

  • кожен рядок починається з >
  • Я хочу замінити перший пробіл в рядку подібним роздільником | або ;
  • після першого регулярного виразу нового рядка поспіль, я хочу також роздільник
  • все між регулярним виразом першого нового рядка і > слід перейти до нового стовпця (це послідовність білка)

1
Ласкаво просимо до Суперкористувача! Наше форматування трохи відрізняється - вам доведеться відступити код на 4 пробіли або натиснути Ctrl-K. Чи можете ви перевірити свій пост і перевірити, чи він відображається правильно зараз?
slhck

Яку операційну систему ви робите? Це визначить, які інструменти доступні.
EBGreen

Windows, як заявлено @ebg
slhck

вибачте, я повинен був бути більш ясним. Яку версію вікон?
EBGreen

Відповіді:


1

Якби я був у вашій ситуації, я б спробував редактор з підтримкою регулярного виразу. Це питання має кілька пропозицій для редакторів як відповіді.

Ви також можете використовувати perl або іншої мови програмування з потужною підтримкою регулярного виразу. Ви можете отримати версію perl з ActiveState , або як частина Cygwin . Cygwin також має редактори з підтримкою регулярного виразу, але для хорошого редактора графічного інтерфейсу вам потрібно буде завантажити та налаштувати частину X-Server Cygwin, і це може бути крута крива навчання для вас, щоб стрибати.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.