Відкриття метаданих про PDF


32

Припустимо, у мене є PDF, і я хочу отримати метадані, доступні для цього PDF. Яку утиліту я повинен використовувати?

Мені здається, що інформацію, яку мене найбільше цікавить, - це розмір паперу - те, про що глядачі PDF зазвичай не повідомляють. Наприклад, це формату PDF, юридична формату, формату А4 чи щось інше? Але й інша доступна інформація може також зацікавити.

EDIT: Ось зручний посібник щодо розмірів паперу, завдяки @terdon.


1
Дивно. Чому хтось спростував це питання? Хочете пояснити?
Faheem Mitha

Відповіді:


39

Одним із канонічних інструментів для цього є pdfinfo, що, якщо я пригадую, постачається з xpdf. Приклад виводу:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5

1
Принаймні, у Debian це частина poppler-утиліт. У мене є файл, у якому pdfinfo повідомляє про 595,2 x 841,44 балів. Але це не повідомляється як А4. Що вирішує позначити його як А4?
Faheem Mitha

2
Імена жорстко закодовані : лист 612 ± 0,1 х 792 ± 0,1, розміри магічними для DIN / ISO A є (все ± 1 пт): 3370.98, 2383.64, 1685.49, 1191.82, 842.74, 595.91, ..., так що здається Ваша сторінка є крихітною занадто вузькою, pdfinfoщоб забрати це.
Ульріх Шварц

Я бачу, біт коду if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))?
Faheem Mitha

Це лист, формати A знаходяться в циклі з sqrt(2)s.
Ульріх Шварц

13

Ще одна утиліта, на яку варто звернути увагу - exiftool . Це може бути не правильним інструментом у вашому конкретному випадку, оскільки він не повідомляє жодної інформації про геометрію документа, але в цілому це, мабуть, найбільш повний інструмент для перевірки метаданих PDF.

Ось приклад команди, яка буде друкувати всю доступну метаінформацію ( -a), відсортовану за групами ( -G1):

exiftool -a -G1 "$File"

Офіційна документація пропонує огляд підтримуваних тегів у форматі PDF:

Ви можете встановити exiftool на Debian / Ubuntu за допомогою:

sudo apt-get install libimage-exiftool-perl

Якщо ви більше вподобали GUI у речах, ви можете спробувати мій проект PDFMtEd . Це набір інструментів, які служать графічними фронтами для exiftool і дозволяють переглядати та редагувати метадані PDF.

Ось кілька скріншотів:

введіть тут опис зображення

введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.