Запитання з тегом «text-processing»

Маніпуляція чи вивчення тексту програмами, сценаріями тощо.

8
Як я можу замінити рядок у файлі (файлах)?
Заміна рядків у файлах на основі певних критеріїв пошуку - дуже поширене завдання. Як я можу замінити рядок fooз barу всіх файлів в поточному каталозі? робити те саме рекурсивно для підкаталогів? замінити, лише якщо ім'я файлу відповідає іншому рядку? замінити лише якщо рядок знайдено в певному контексті? замінити, якщо рядок …
751 text-processing  awk  sed  perl 

4
Чому printf кращий за відлуння?
Я чув, що printfце краще, ніж echo. Я можу згадати лише один екземпляр зі свого досвіду, коли мені довелося скористатися, printfоскільки echoне працювало для подачі тексту в якусь програму на RHEL 5.8, але printfце було. Але, мабуть, є й інші відмінності, і я хотів би дізнатися, що вони таке, а …

10
Як додати кілька рядків до файлу
Я пишу сценарій bash, щоб шукати файл, якщо його не існує, тоді створіть його та додайте до нього: Host localhost ForwardAgent yes Тому "line then new line 'tab' then text"я думаю, що це чутливий формат. Я знаю, що ти можеш це зробити: cat temp.txt >> data.txt Але це здається дивним …

8
Чи може виводити греп лише ті визначені угрупування, які відповідають?
Скажіть, у мене є файл: # file: 'test.txt' foobar bash 1 bash foobar happy foobar Мені хочеться лише знати, які слова з’являються після "foobar", тому я можу використовувати цей регулярний вираз: "foobar \(\w\+\)" Дужки вказують на те, що я маю особливий інтерес до цього слова відразу після foobar. Але коли …

4
Чому використання циклу оболонки для обробки тексту вважається поганою практикою?
Чи використовується цикл час для обробки тексту, як правило, поганою практикою в оболонках POSIX? Як вказував Стефан Шазелас , одні з причин невикористання шлейфу оболонки - концептуальність , надійність , розбірливість , ефективність та безпека . Ця відповідь пояснює аспекти надійності та розбірливості : while IFS= read -r line <&3; …

18
Як ви сортуєте du вихід за розміром?
Як сортувати du -sh /dir/*за розміром? Я прочитав один сайт, який говорив про використання, | sort -nале це, очевидно, неправильно. Ось приклад, що неправильно. [~]# du -sh /var/* | sort -n 0 /var/mail 1.2M /var/www 1.8M /var/tmp 1.9G /var/named 2.9M /var/run 4.1G /var/log 8.0K /var/account 8.0K /var/crash 8.0K /var/cvs 8.0K …


10
Як обрізати пробіли та пробіли з кожного рядка деякого результату?
Я хотів би видалити всі провідні та кінцеві пробіли та вкладки з кожного рядка у висновку. Чи є такий простий інструмент, як trimя міг би передати свій вихід? Приклад файлу: test space at back test space at front TAB at end TAB at front sequence of some space in the …

6
Як я можу обернути текст певним розміром стовпця?
Я знаю, що я можу використовувати щось на кшталт cat test.txt | pr -w 80обертання рядків на 80 символів, але це дає багато місця у верхній і нижній частині друкованих рядків, і це не працює правильно в деяких системах Який найкращий спосіб змусити текстовий файл із довгими рядками обгортати на …

14
Замініть рядок у величезному (70 Гб), одному рядку, текстовому файлі
У мене величезна (70 Гб), один рядок , текстовий файл, і я хочу замінити рядок (маркер) в ньому. Я хочу замінити маркер <unk>на інший фіктивний маркер ( випуск рукавичок ). Я спробував sed: sed 's/<unk>/<raw_unk>/g' < corpus.txt > corpus.txt.new але вихідний файл corpus.txt.newмає нульові байти! Я також спробував використовувати perl: …

9
Як видалити повторювані рядки всередині текстового файлу?
Величезний (до 2 ГБ) мій текстовий файл містить близько 100 точних дублікатів кожного рядка в ньому (в моєму випадку непотрібний, оскільки файл - це таблиця даних, схожа на CSV). Що мені потрібно - це видалити всі повтори, при цьому (бажано, але це може бути пожертвовано для значного підвищення продуктивності), підтримуючи …

6
видалити конкретні символи зі змінної за допомогою bash
Я хочу проаналізувати змінну (в моєму випадку це версія комплекту розробників), щоб зробити її точкою ( .) безкоштовно. Якщо version='2.3.3'бажаний вихід є 233. Я спробував, як нижче, але це вимагає .замінити іншим символом, який дає мені 2_3_3. Було б добре, якби tr . ''працювали. 1 VERSION='2.3.3' 2 echo "2.3.3" | …

4
Повертайте лише частину рядка після відповідного шаблону
Таким чином, відкриття файлу з, catа потім використання grepдля отримання відповідних рядків отримує мене поки що, коли я працюю з конкретним набором журналів, з яким я маю справу. Потрібен спосіб зіставлення ліній за шаблоном, але лише повернення частини рядка після відповідності. Частина до і після матчу постійно змінюватиметься. Я грав …

13
Розшифровка кодування URL-адрес (відсоткове кодування)
Я хочу розшифрувати кодування URL-адрес, чи є якийсь вбудований інструмент для цього чи хтось міг надати мені sedкод, який це зробить? Я пошукав трохи через unix.stackexchange.com та в Інтернеті, але не зміг знайти жодного інструмента командного рядка для декодування кодування URL. Що я хочу зробити, це просто змінити txtфайл так, …

15
Стандартний інструмент для перетворення підрахунку байтів у людський KiB MiB тощо; як дю, ls1
Чи є стандартний інструмент, який перетворює ціле число байтів у читабельний для людини кількість найбільшого можливого розміру одиниці, зберігаючи числове значення між 1,00 та 1023,99? У мене є власний скрипт bash / awk, але я шукаю стандартний інструмент, який можна знайти в багатьох / більшості дистрибутивів ... щось більш загальнодоступне, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.