Запитання з тегом «text-processing»

Маніпуляція чи вивчення тексту програмами, сценаріями тощо.

2
Розбір XML, JSON та новіших форматів файлів даних у UNIX за допомогою утиліт командного рядка
У середовищі Unix є чудові інструменти для розбору тексту в різних формах. Однак, пізно, дані не є у традиційних (історичних) форматах (CSV, TSV, на основі записів чи інших обмежувачів), як це було раніше. Ці дані обмінюються в такі структуровані формати, як XML / JSON. Я знаю, що є кілька хороших …

3
Виконувати дві речі з результатом команди
У мене є програма, texcountяка виводить кількість слів у моєму документі LaTeX. Я також можу sedподати висновок цього для того, щоб зробити нові рядки TeX рядків і записати це у файл, який потім я можу включити у свій остаточний документ. Але коли я виконую texcount foo.tex | sed s/$/'\\\\'/ > …


2
греп оточуючих персонажів сірника
Я хочу знайти і замінити гігантський дамп бази даних, і він не робить те, що, на мою думку, має відбутися. Я хотів би прогорнути мій цільовий рядок у файлі, а потім побачити навколишні 8 символів або близько того (мені може знадобитися коригувати це число, залежно). Як я можу це зробити? …

2
Як я витягую лише алфавітно-цифрові символи з заданого текстового файлу та роздруковую їх?
У мене є текстовий файл, схожий на текст, який вставлено нижче. Я хочу витягнути у файл будь-які символи, що мають буквено-цифровий характер, і проігнорувати все інше. Який найпростіший спосіб зробити це ( grep, cut)? %[{]$#{!^]^$#+*$}#*)(]!@^&#){][$)}!+%^)@#&!%(+^^($(%}^+[*)#+{%!))}(*&]__})][_))}# %())#&##{]$#$](&$%&&$)^{(@%)$%()#)&&*{]&^^+%$##%{!(_$(**&(_]+{%[%$!_){$*@@++]&^$( %@+{+&%]$)+@({$(+{!*#(%)]+[}){]]#)*[]%&{+)$){!&$]+^++_@]#%)[&&^%]#@#@)]@}%$[_*@%) %[&*^*})@(!{&^#!([%@_![{)+)$}_+)%&^#@#$$}))^&)}({+*&_()&@]$^#(&&{){)_[}{@(}#)!)%& %({+$[!#()[]%{$_*]*^%&]@{^@{)}}_^}@!^*)_[([{}]{*#{]&}}[$_[}!%%&_{{!$[}&[[@#[&_$() %*_$+)&}*){${}!]+%[{{!+)+{!&]$!}{_]&)!!^+){&*#{@!##_(^%^$([!+&+($&)##[&[^_{##{(** %{{)#*%@*[(^(}!%}@*}@+]^_}&&&}&{[$(@[#*+%[&%{$$**]]%(!$+$!]^+[^_(&*{#_^%[[#+{]#_[ %*}]#)!%!_[})^%*@{!{$)*_+$$*}%(&]%^+$@!&{[]}**})}#}[#{%{$#@##(])&)((${^]^[%^&(!_&

2
знайти певний рядок і видалити всю структуру
У мене є вертикальний файл, де кожне слово (маркер) знаходиться в окремому рядку в 4 стовпцях. Там також метаструктур <doc>, <s>... Документи виглядають наступним чином : <doc name="sth" url="http"> <p> <s> Here here k1gInSc1 here is be k1gMnPc2 be a a k2eAgMnPc1d1 a sentence sentence k1gMnPc1 sentence <g/> . . …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.