Запитання з тегом «text-processing»

Маніпуляція чи вивчення тексту програмами, сценаріями тощо.


2
Труби, як надходять дані в трубопровід?
Я не розумію, як дані надходять у конвеєр, і сподіваюся, що хтось міг би пояснити, що там відбувається. Я думав, що конвеєр команд обробляє файли (текст, масиви рядків) по черзі. (Якщо кожна команда сама працює рядок.) Кожен рядок тексту проходить через конвеєр, команди не чекають, коли попередній закінчить обробку всього …

17
Як знайти рядок з найменшими символами
Я пишу сценарій оболонки, використовуючи будь-які загальні команди UNIX. Я повинен отримати рядок, що містить найменше символів (включено пробіл). Тут може бути до 20 рядків. Я знаю, що можу використати head -$L | tail -1 | wc -mдля пошуку числа символів рядка L. Проблема полягає в тому, що єдиним методом, …

1
Сортуйте дані у порядку зменшення першого стовпця, для рівних значень використовуйте другий стовпчик у порядку зростання
Дозвольте мені уточнити: Припустимо, у мене є кілька ключових слів з частотою їх використання: 12 Hi 7 Hash 7 C++ 9 Superuser 17 Stackoverflow 9 LaTeX 42 Life 9 Ubuntu Що я хочу, це сортувати ці дані на основі частоти у порядку зменшення, і якщо є деякі рівні значення, він …

6
Перетворення між формами нормалізації Unicode у командному рядку unix
У Unicode деякі комбінації символів мають більше одного представлення. Наприклад, символ ä може бути представлений як "ä", тобто кодова точка U + 00E4 (два байти c3 a4в кодуванні UTF-8), або як "ä", тобто дві кодові точки U + 0061 U + 0308 (три байти 61 cc 88в UTF-8). Згідно стандарту …

4
sed - замініть рядок вмістом файлу
У мене два файли: file1і file2. file1 містить такий зміст: --- host: "localhost" port: 3000 reporter_type: "zookeeper" zk_hosts: - "localhost:2181" file2містить IP-адресу ( 1.1.1.1) Те , що я хочу зробити , це замінити localhostз 1.1.1.1, так що кінцевий результат: --- host: "1.1.1.1" port: 3000 reporter_type: "zookeeper" zk_hosts: - "1.1.1.1:2181" Я …

4
Чи можливо в баші почати читати файл із зміщення підрахунку байтів довільного обміну?
Я хочу знайти дату, яка знаходиться десь у журналі 8 Гб (текст). Чи можу я трохи обійти повне послідовне читання і спочатку зробити двійкові розщеплення файлу (розмір) або якимось чином переміститися по файловій системі inodes(про яку я дуже мало знаю ), щоб почати читання з кожного розділеного пункту, поки не …

7
Не жадібна відповідність з регулярним виразом SED (емуляція perl's. *?)
Я хочу використовувати sedдля заміни будь-чого в рядку між першим ABі першим виникненням AC(включно) на XXX. До прикладу , у мене є цей рядок (цей рядок тільки для тесту): ssABteAstACABnnACss і я хотів би висновок , подібний цьому: ssXXXABnnACss. Я зробив це з perl: $ echo 'ssABteAstACABnnACss' | perl -pe …

7
хвіст -f, але з номерами рядків
Я намагаюся побачити, скільки разів foo barз’являється /var/log/foo.logпротягом довільної кількості часу на віддаленому сервері, але нічого, що я намагався до цього часу, не спрацювало. У мене вже є сценарій таймера, який я використовую, щоб відслідковувати, скільки часу минуло з моменту початку хвостової стрічки /var/log/foo.log, і тепер я просто хотів би …

4
розділити довгу лінію на роздільнику
Яку команду я можу використовувати для поділу вводу таким чином: foo:bar:baz:quux в це? foo bar baz quux Я намагаюся розібратися з cutкомандою, але, здається, вона працює лише з фіксованою кількістю введення, як-от "перші 1000 символів" або "перші 7 полів". Мені потрібно працювати з довільно довгим введенням.

6
Електронні таблиці дружніх командних рядків
Чи існує така річ? Текстові таблиці, які добре відображаються в середовищі CLI. Я усвідомлюю, що я міг би cat foobar.csvробити та робити як завгодно, але це не особливо практично чи привабливо. Я не можу уявити, що важко буде відформатувати таблицю, і, можливо, також слідкуйте за певними правилами (математика?). У Emacs …

4
Як видалити решту кожного рядка після певного шаблону чи рядка у файлі?
Припустимо, у мене в текстовому файлі є список URL-адрес: google.com/funny unix.stackexchange.com/questions isuckatunix.com/ireallydo Я хочу видалити все, що з’явиться після '.com'. Очікувані результати: google.com unix.stackexchange.com isuckatunix.com я намагався sed 's/.com*//' file.txt але видалено .comтакож.

13
Як я можу видалити всі коментарі з файлу?
У мене є файл із коментарями: foo bar stuff #Do not show this... morestuff evenmorestuff#Or this Я просто хочу надрукувати весь коментований код: foo bar stuff morestuff evenmorestuff Вміти знімати коментарі з файлу так важливо ... Який хороший спосіб це зробити?

2
знайти спільні рядки між кількома файлами
У мене є 4 файли, які схожі file A >TCONS_00000867 >TCONS_00001442 >TCONS_00001447 >TCONS_00001528 >TCONS_00001529 >TCONS_00001668 >TCONS_00001921 file b >TCONS_00001528 >TCONS_00001529 >TCONS_00001668 >TCONS_00001921 >TCONS_00001922 >TCONS_00001924 file c >TCONS_00001529 >TCONS_00001668 >TCONS_00001921 >TCONS_00001922 >TCONS_00001924 >TCONS_00001956 >TCONS_00002048 file d >TCONS_00001922 >TCONS_00001924 >TCONS_00001956 >TCONS_00002048 всі файли містять більше 2000 рядків і відсортовані для першого стовпця. …

1
Перетворити нові рядки в нульові обмеження при використанні хвоста
Як я можу змінити результат tailна використання нерегулярних рядків замість нових рядків? Моє запитання схоже на таке: Як зробити `голову` та` хвіст` на введеному нулевим вході в bash? , але відрізняється тим, що я хочу зробити щось на кшталт: tail -f myFile.txt | xargs -i0 myCmd {} "arg1" "arg2" Я …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.