Об’єднайте PDF-файли у правильному порядку


2

Я шукаю спосіб (бажано за допомогою командного рядка в Linux) об'єднати окремі PDF-файли розділів книг в один PDF-файл книги у правильному порядку (можливо, виходячи з номерів сторінок у PDF-файлах чи за деякою евристикою) .

Тому я хочу, щоб я міг зайти до редакції, що містить усі окремі глави, і просто робити

joinpdf-magic-command *.pdf

і мати вихідний PDF у правильному порядку.

Я знайшов безліч інструментів для об'єднання PDF-файлів ( pdfjoin, pdftk), але всі вони розміщують PDF-файли в тому порядку, який вони відображаються в командному рядку.

редагувати:

Прикладним списком розділів може бути:

1-Introduction.pdf
2-The-analog-digital-interface.pdf
3-Adaptive-digital-systems.pdf
4-Non-linear-applications.pdf
5-Spectral-analysis-and-modulation.pdf
6-Introduction-to-Kalman-filters.pdf
7-Data-compression.pdf
8-Error-correcting-codes.pdf
9-Digital-signal-processors.pdf
Appendix-1-Solutions-to-problems.pdf
Appendix-2-A-MATLAB-Simulink-primer.pdf
Glossary.pdf
Index.pdf
Preface.pdf
References.pdf

Але для інших книг будуть й інші розділи, їхні назви можуть бути різними, і навіть розділи з такою ж назвою можуть бути призначені навіть для різних порядків. Тому я згадав, що ключовим моментом може бути використання номерів сторінок.


будь ласка, вкажіть ОС, якщо ви хочете отримати більш конкретну допомогу. Ви спробували скористатися кроком для перейменування файлів у правильний порядок?
Джуліан Найт

Питання щодо рекомендацій щодо товарів, послуг або навчальних матеріалів поза темою, оскільки вони швидко застарівають і залучають відповіді на основі думки. Натомість опишіть свою ситуацію та конкретну проблему, яку ви намагаєтеся вирішити. Поділіться своїми дослідженнями.
LPChip

@LPChip Гаразд, я видалив частину про пошук інструменту. Я просто хочу знати, чи є спосіб це зробити.
дшеферд

1
ImageMagick convertможе робити такі речі, хоча я не знаю точно, як це стосується конкретного випадку. Спробуйте: встановіть ImageMagick, потімconvert chap1.pdf chap2.pdf chap3.pdf book.pdf
CVn

2
@ MichaelKjörling: OMG, ви можете видалити свій коментар ще раз, незважаючи на оновлення. Створювати багатосторінкові PDF-файли за convertдопомогою злочину! Це злочин проти тверезості та здорового глузду, тому що він перемелює м'ясо всіх приємних векторних елементів із вмісту PDF у растрові зображення на повній сторінці. Особливо форма команди, яку ви надали - вона буде використовувати роздільну здатність за замовчуванням 72 DPI, втрачаючи лоти та партії оригінальної якості та викидаючи всю інформацію про шрифт, пошук та доступність. Я навіть не можу ...
Курт Пфайфл,

Відповіді:


3

Немає ніякої магії, яку можна використовувати для автоматичного сортування розділів вашої книги - ні, якщо конвенція про іменування файлів не підтримує її. Це вчинок, який має здійснити людина.

Єдиний спосіб зробити це швидко - вписати впорядковані назви файлів у текстовий файл, аналогічно тому, що ви цитували у вашій ОП.

Потім просто запустіть:

pdftk $(cat mychapters.txt) cat output book.pdf

2

Особисто я б не шукав нового інструменту, а радше загортав робочий процес у сценарій, щоб забезпечити правильний порядок.

Я припускаю, що у вас є певний спосіб визначити правильний порядок, інакше це взагалі неможливо. В ідеалі, ви б назвали файли такими, що вони автоматично потрапляють у правильний порядок:

01ChapterTitleOne.pdf
02ChapterTitleTwo.pdf
etc.

і так далі. У вас може бути номер глави в кінці, хоча (як у прикладі Майкла), який порушує сортування. У цьому випадку слід додати крок до сценарію робочого процесу, який перейменовує файли, щоб вони потрапили у правильний порядок.

Поки файли послідовно іменуються, це не повинно бути проблемою. Якщо ви можете поділитися додатковою інформацією про іменування, я впевнений, що ми можемо придумати сценарій BASH для цього.

Після того, як ви все правильно назвете, ви зможете використовувати ту саму команду, з якою ви почали, як і другий крок сценарію робочого процесу. Якщо це не вийшло, то вам знадобиться трохи складніший сценарій BASH, який перетинає файли у правильному порядку.

Все це стандартний матеріал для сценаріїв BASH, але все обертається навколо того, щоб послідовно називати файли.


Я редагував питання, щоб додати приклад. Проблема з таким підходом полягає в тому, що ви часто не можете покладатися на назви файлів, щоб надати вам замовлення (хоча, можливо, вдало здогадатися за допомогою досить складного сценарію).
дшеферд

1
Але PDF-файли насправді не містять структурованих даних, тому виявлення номерів сторінок було б дуже складним, можливо, неможливим. Простіше працювати назад за течією і змусити письменників прийняти конвенцію про іменування.
Лицар Джуліана

Так виглядає так :( Ну все одно спасибі.
dshepherd
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.