Запитання з тегом «text-processing»

Маніпуляція чи вивчення тексту програмами, сценаріями тощо.


2
Що таке пітонний еквівалент grep -v?
Мені подобається grep -v. Я ним користуюся постійно. Але я також роблю деяку обробку тексту в python, і є одна важлива річ, якої мені бракує. Зазвичай я grep -vвиймаю сторонні речі з тексту. Наприклад, $ grep -v '[a-z]' # (I manually review this output to confirm that I don't want …

5
Сортуйте текстові файли з кількома рядками у вигляді рядків
У мене є текстовий файл у такому форматі: #################################### KEY2 VAL21 VAL22 VAL23 VAL24 #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY3 VAL31 VAL32 VAL33 VAL34 Я хочу сортувати цей файл за KEYрядком і зберігати з ним наступні 4 рядки в результаті, таким чином відсортований результат повинен бути: #################################### KEY1 …

6
Як порівняти два різних файли по рядку в unix?
Файл1: 123 234 345 456 Файл2: 123 234 343 758 Очікуваний вихід: File3: TRUE TRUE FALSE FALSE тому код повинен порівнювати два файли та друкувати "TRUE", якщо він відповідає іншому, він повинен надрукувати "FALSE" у новому файлі. Може хто-небудь, будь ласка, надати рішення для цього?

3
Як скоротити файл до максимальної кількості символів (не байтів)
Як я можу врізати текстовий файл (закодований UTF-8) до заданої кількості символів? Мене не хвилює довжина рядків, і розріз може бути в середині слова. cut здається, працює на лініях, але я хочу цілий файл. head -c використовує байти, а не символи.

6
Як вирівняти список до конкретного символу?
Чи є команда чи набір команд, які я можу використовувати для горизонтального вирівнювання рядків тексту до довільного символу? Наприклад, зі списком адрес електронної пошти на виході буде створено текстовий файл із усіма символами '@', розташованими вертикально. Для успіху я вважаю, що змінну кількість порожніх пробілів потрібно додати до початку більшості …


3
Двійковий пошук у відсортованому текстовому файлі
У мене великий сортований файл з мільярдами рядків змінної довжини. З огляду на новий рядок, я хотів би знати, яке число байтів воно отримало, якби воно було включене до сортованого файлу. Приклад a\n c\n d\n f\n g\n З огляду на вхід 'foo', я отримав би результат 9. Це легко зробити, …


4
Як використовувати sed, щоб маніпулювати вихідним потоком?
Я збираю презентацію для нетехнічної аудиторії. У мене є програма, що працює в bash, яка виводить безперервний потік значень, кілька з яких є важливими. Я хотів би виділити важливі результати, оскільки вони відображаються, щоб аудиторія змогла зрозуміти їх частоту. Проблема полягає в тому, що я не можу дістатись sedдо запущеного …

9
Інструмент командного рядка для "кішки" попарно розширення всіх рядків у файлі
Припустимо, у мене є файл (назвіть його sample.txt), який виглядає приблизно так: Row1,10 Row2,20 Row3,30 Row4,40 Я хочу мати можливість працювати над потоком із цього файлу, який по суті є попарною комбінацією всіх чотирьох рядків (тому ми повинні отримати в цілому 16). Наприклад, я шукаю потокову (тобто ефективну) команду, де …


5
нелінійний інструмент для заміни рядків?
Нещодавно я задав питання про те, як видалити символ нового рядка, якщо він виникає після іншого конкретного символу. Інструменти для обробки тексту Unix є дуже потужними, але майже всі вони мають справу з рядками тексту, що добре протягом більшої частини часу, коли вхід вкладається у наявну пам'ять. Але що робити, …

3
Розділіть файл на кілька невеликих файлів, окремо символом нового рядка
Чи є утиліта, яка розділяє файл на символ нового рядка? наприклад, якщо файл містить такі рядки, aa bbb cccc Якщо я хочу розділити його на 3 файли, бажаним результатом буде: aa, bbbІ cccc(у 3 різних файлах) Я вже перевірив splitкоманду, вона вирізала файл лише за розмірами файлів, а не тим, …

2
Як видалити всі екземпляри певного символу з текстового файлу?
У мене величезний (близько половини GiB, неможливо використовувати звичайний текстовий редактор) CSV-файл із полями, укладеними у подвійні лапки, "abc","def"але потрібен файл без лапок (я впевнений, що це не буде порушувати послідовність файлів - кома ніколи не використовується всередині значень). Як видалити всі лапки (без введення пробілів на їх місцях)?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.