Як вказати вираз sed для видалення недрукувальних восьмеричних символів з текстового файлу

Я новачок у сім і прибираю дуже великий файл. Очищений документ виглядає правильно, але коли я читаю його в R, він показує, що кожен рядок додається \016\tв кінці кожного рядка. Я зрозумів, що \tце вкладка і що \016це octl (?), Але я не зовсім зрозумів, як вкласти це в правильний вираз.

Будемо дуже вдячні за будь-яку допомогу новому користувачеві sed (та вирази reg!).

regex sed

— Брайан П
джерело

На жаль, ми не є сервісом написання коду. Замість того, щоб просто просити код для виконання певного завдання, покажіть нам, що ви намагалися до цього часу (включаючи будь-який код, який у вас є зараз) і де ви застрягли, щоб ми могли допомогти вам у вирішенні вашої конкретної проблеми. Питання, які запитують лише код, занадто широкі і, ймовірно, можуть бути затримані або закриті .

— bwDraco

Це не широке запитання, це про одну конкретну річ.

— Кевін Панько

Наступні роботи з bash:

sed $'s/\016\t$//' infile >outfile

Режекс \016\t$відповідає восьмериці 016та вкладці в кінці рядка. Якщо цей рядок знайдений, він замінюється нічим.

Формат рядка $'...'вимагає bash. Я тестував вище за допомогою GNU, sedале, як повідомляється, він повинен працювати і з BSD sed.

Інший метод, який працює з GNU sedбез bash, є:

sed 's/\o016\t$//' infile >outfile

— John1024
джерело