Ідентифікація
Я знайшов цей інструмент, який виглядає як те, що ви можете використовувати для ідентифікації файлів PDF / A. Це називається DROID (цифровий запис та ідентифікація об'єкта) . Це на основі Java і може запускатися з графічного інтерфейсу або командного рядка.
витяг
DROID - це програмний інструмент, розроблений Національним архівом для виконання автоматизованої пакетної ідентифікації форматів файлів. Розроблений відділом цифрового збереження в рамках своєї більш широкої цифрової збереження, DROID призначений для задоволення основоположних вимог будь-якого цифрового сховища, щоб мати змогу ідентифікувати точний формат усіх збережених цифрових об'єктів та зв'язувати цю ідентифікацію з центральним реєстром технічної інформації про цей формат та його залежності.
Враховуючи, що він фінансується Національним архівом, я вважаю, що це правильний інструмент для цього, враховуючи передбачувану мету формату PDF / A. Також проект є відкритим кодом, і код доступний на Github , а також упакований у двійковій формі з веб-сайту Національного архіву .
Перевірка та конверсія
Якщо ви шукаєте інструмент для перевірки та перетворення, я вважаю, що PDFBox може це зробити. PDFBox перелічує PDF / Право на підтвердження на першій сторінці свого веб-сайту. Це ще одна програма Java 8-).
витяг з веб-сайту
PDF / A Validation Валідація
PDF-файлів відповідно до стандарту PDF / A ISO.
У розділі інструментів командного рядка зліва на їх головній сторінці показано таке використання інструменту:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF - ще один інструмент, здатний перевірити PDF / A; він є частиною довідкового інструментарію Фонду відкритого збереження. Це також програма Java.
Перетворення
Я просто знайшов цей метод із публікації в блозі під назвою: Безкоштовний спосіб конвертувати існуючий PDF в PDF / A , який використовує такі інструменти:
- Ghostscript 8.64 Тільки
- PDFBox 0.7.3
- pdfmark (файл для подачі додаткових метаданих)
- PDFA_def.ps
- USWebCoatedSWOP.icc
З вищезазначеним місцем ви використовуєте таку команду:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
Не обійшлося і без бородавок. У статті обговорюється одна з них, фіксуючи прапори друку на гіперпосиланнях, що є одним із них. У статті подано програму Java, яку ви можете скористатись для виправлення таких:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
Це не дуже, але, здається, працює. Докладніше див. У статті .
Список літератури