Запитання з тегом «csv»

Файли, що містять дані, розташовуються в таблиці, часто комами (отже, знаками, розділеними комами), до окремих стовпців. Рядки розділені новими рядками (але не всі нові рядки - це роздільники рядків, оскільки поля можуть бути цитовані, щоб містити розділові рядки. Використовуйте цей тег для повноцінних даних CSV, а не для простого випадку одного запису на рядок або зовсім без котирування (використовуйте csv-simple для такого роду даних).


2
Як відобразити TSV (csv) у консолі, коли порожні комірки пропущено: `column -t -s $ '\ t'`
У мене є файл із стовпцями, на яких позначено tab. У мене є файл, коли деякі рядки мають порожні комірки (на початку, посередині). У таких випадках column -t -s $'\t'просто не вдається: Вхід: $ echo -e 'A\tB\tC\tD\n\tb1\t\td1\n\t\t\td2\na3\t\t\td3' > in.tsv $ hexdump -C in.tsv 00000000 41 09 42 09 43 09 …

6
Видаліть рядки з файлу залежно від рядків, знайдених в іншому файлі
Файл file1.txt містить такі рядки, як: /api/purchase/<hash>/index.html Наприклад: /api/purchase/12ab09f46/index.html Файл file2.csv містить рядки, такі як: <hash>,timestamp,ip_address Наприклад: 12ab09f46,20150812235200,22.231.113.64 a77b3ff22,20150812235959,194.66.82.11 Я хочу фільтрувати file2.csv, видаляючи всі рядки, де значення хешу присутнє також у file1.txt. Це означає: cat file1.txt | extract <hash> | sed '/<hash>/d' file2.csv або щось подібне. Це повинно бути …

2
Повторне накладання великого файлу CSV
Я переглянув відповіді в цій корисній темі , але моя проблема здається досить різною, що я не можу придумати гарну відповідь (принаймні, з sed). У мене великий файл CSV (200+ ГБ) із рядками, які виглядають так: <alphanumerical_identifier>,<number> де <alphanumerical_identifier>є унікальним по всьому файлу. Я хотів би створити окремий файл, який …
11 files  sed  awk  csv 

3
Форматуйте команду "ps" без пробілів
У мене є така psкоманда, щоб отримати особливі властивості всіх запущених процесів разом з деякими властивостями: ps --no-headers -exo "uname,ppid,pid,etime,%cpu,%mem,args" Я хочу, щоб він був відформатований у CSV, щоб я міг його розібрати. Примітка. Я поставив аргументи в кінці, щоб полегшити розбір; Я не думаю ,, що в будь-якому з …
11 csv  ps 

5
Заміна підкреслення комою та видалення подвійних лапок у CSV
У мене файл CSV як input.csv "1_1_0_0_76" "1_1_0_0_77" "1_1_0_0_78" "1_1_0_0_79" "1_1_0_0_80" "1_1_0_0_81" "1_1_0_0_82" "1_1_0_0_83" "1_1_0_0_84" "1_1_0_0_85" ............. і так далі. Мені потрібно конвертувати цей CSV-файл у result.csv 1,1,0,0,76 1,1,0,0,77 1,1,0,0,78 1,1,0,0,79 1,1,0,0,80 1,1,0,0,81 1,1,0,0,82 1,1,0,0,83 1,1,0,0,84 1,1,0,0,85

4
Видаліть лише коси, наявні в подвійних лапках
У текстовому файлі я хочу видалити ,(коми), а також "(лапки) (лише якщо подвійні лапки містять числа, розділені комами). 56,72,"12,34,54",x,y,"foo,a,b,bar" Очікуваний вихід 56,72,123454,x,y,"foo,a,b,bar" Примітка. Наведений вище рядок я показую лише як приклад. Мій текстовий файл містить безліч рядків, як вище, і числа, розділені комами, наявними в подвійних лапках, повинні відрізнятися. Це …

5
Розбір обмеженого текстового файлу в bash як аргументи команди
У мене текстовий файл розділений так: field1,field2,field3 xield1,xield2,xield3 dield1,dield2,dield3 gield1,gield2,gield3 Кожен із цих стовпців буде параметром програми, і я хотів би, щоб програма викликалася для кожного рядка Я сподівався на цикл, щось на кшталт: for $i in file command $field2 -x $field3 -PN -$field1 >> output done Що було б …

1
awk несподівано видаляє крапку з рядка
Я хочу додати стовпчик (2-е місце) у .csvфайл, і я хочу, щоб значення цього стовпця були рядками та цитувались; Наступна команда додає стовпчик, але без лапок: awk -F"," 'BEGIN { OFS = "," } {$2="2.4.0"; print}' test.csv > output.csv Наступний підхід містить цитати, але він чомусь видаляє останню .(крапку) зі …
9 awk  csv 

1
Як отримати рядки, чий n-й стовпчик містить m-й стовпчик
У мене файл CSV містить домени та веб-пошти, наприклад: site1.com,mail.site1.com site2.com,testmail.com site3.com,mx.site3.com site4.com,smtp.site4.com site5.com,foomail.com site6.com,barmail.com site7.com,webmail.site7.com site8.com,01mx.site8.com site9.com,foobarmail.com site10.com,mx-smtp222.site10.com Я хочу отримати рядки, де стовпець веб-пошти містить стовпчик доменів того ж рядка. Для прикладу вище, вихід повинен бути: site1.com,mail.site1.com site3.com,mx.site3.com site4.com,smtp.site4.com site7.com,webmail.site7.com site8.com,01mx.site8.com site10.com,mx-smtp222.site10.com

7
Зберігайте лише рядки, що містять точну кількість роздільників
У мене величезний файл csv з 10 полями, розділеними комами. На жаль, деякі рядки неправильно сформовані і не містять рівно 10 коми (що спричиняє деякі проблеми, коли я хочу прочитати файл у R). Як я можу відфільтрувати лише рядки, які містять рівно 10 коми?
9 csv  filter 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.