Я завантажую досить гігантський файл у базу даних postgresql. Для цього я спочатку використовую split
у файлі для отримання менших файлів (30Gb кожен), а потім завантажую кожен менший файл у базу даних за допомогою GNU Parallel
і psql copy
.
Проблема полягає в тому, що потрібно розділити файл близько 7 годин, а потім він починає завантажувати файл на ядро. Що мені потрібно, це спосіб сказати split
надрукувати ім'я файлу для виведення std кожного разу, коли він закінчує запис файлу, щоб я міг передати Parallel
його, і він починає завантажувати файли в момент split
закінчення його написання. Щось на зразок цього:
split -l 50000000 2011.psv carga/2011_ | parallel ./carga_postgres.sh {}
Я прочитав split
сторінки чоловіків і нічого не можу знайти. Чи є спосіб це зробити за допомогою split
будь-якого іншого інструменту?