Перегляньте внутрішню структуру PDF


18

Як переглядати внутрішню структуру PDF у Adobe 9.0?

Я не знайшов розширене меню, яке має цю опцію.

Чи може мені допомогти будь-який орган?

pdf 

Відповіді:


23

Існує кілька способів перегляду внутрішньої структури PDF.

Pdfs є своєрідними для людського читання

Якщо заборонити паролі безпеки, значна частина їх читається людиною. Якщо у PDF є пароль, усі рядки та потоки (які вже будуть стиснуті, втрат не буде) будуть псевдовипадковим сміттям. Стислі потоки даних мають багато, але багато з них виглядає приблизно так у вашому улюбленому текстовому редакторі:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Попередження: пробіли в значній мірі не мають значення і зазвичай видаляються, коли це можливо. Я просто зробив це досить, щоб зрозуміти це трохи простіше.

<< і >> починаються і закінчуються "словниками". Словники складаються з пар / значення. Ключ - це завжди "ім'я": всі імена починаються з "/". Значення може бути будь-яким, включаючи інше ім’я.

[ і ] починати і закінчувати "масиви". Масиви можуть складатися практично з усього, що завгодно.

Числа - це "числа". Плаваюча точка або іншим чином.

() і <> починають і закінчують "рядки". <> рядки вказані у вигляді шістнадцяткових значень, () - рядки ANSI.

Pet Peeve: / Імена та (рядки) використовують абсолютно різні системи втечі. Grr

Непрямі посилання вказують на інші об’єкти в PDF:
<objNum> <generationNum-AlwaysZero> R

У наведеному вище прикладі об'єкта потік вмісту знаходиться в об'єкті 4, в іншому місці PDF. Щоб знайти його, ви можете скористатися пошуком тексту редакторів для "N 0 obj", де N - потрібний номер об'єкта.
ПОПЕРЕДЖЕННЯ. У PDF є сотні, можливо, тисячі об'єктів. Якщо шукати "1 0 obj", ви отримаєте багато звернень.

З огляду на те, що ви просите переглянути внутрішню структуру, ви, напевно, все це вже знаєте. Інші, хто хоче знати те саме, можуть не робити.

УВАГА: Не редагуйте PDF у текстовому редакторі. Все те, що бінарний матеріал буде виправлено, зміна байтів дуже важлива в PDF.

Плагін Acrobat [s]

Існує плагін для акробатів під назвою PDF CanOpener від Windjack Solutions (немає приналежності). Це SLICK. Ви зможете переглядати структуру PDF як дерево, переглядати (і змінювати) потоки вмісту тощо.

Додатки сторонніх організацій

Багато. Багато людей будують його як частину навчання розбору PDF або як інструмент налагодження. Вони досить зручні.

iText RUPS (частина iText, вкладений файл Java PDF, зараз на GitHub)

Веб-переглядач PDF

PDF Vole


1
PDF VoleЗдається, посилання зараз зламана ...
ДНК

5
+1 для iText RUPS, не дуже доброзичливий графічний інтерфейс, але працює, до речі, схоже, URL-адреса проекту ( sourceforge.net/projects/itextrups )
Jaime Hablutzel

2
iText RUPS переміщено сюди: github.com/itext/rups
bmaupin

1
Тут є копія вихідного коду pdfvole
yms

1
Якщо PDF має стиснуті потоки даних, утиліта командного рядка qpdf може їх декодувати / видаляти та виписувати PDF з більш зрозумілим вмістом: `qpdf --decode-level = all - stream-data = unpress inputfile.pdf extensionfile. pdf
skierpage

7

O2Solutions пропонують сумісну з MS Windows утиліту для перегляду внутрішньої структури документів PDF. Це безкоштовно для особистого та комерційного використання.

http://www.o2sol.com/pdfxplorer/overview.htm


4

Ви можете переглядати внутрішню структуру PDF в Adobe Acrobat, використовуючи його Browse Internal PDF Structureкоманду з плагіну Preflight:

http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/

Ви також можете використовувати комерційний плагін PDF CanOpener для Acrobat, щоб побачити структуру об'єкта або безкоштовний PDFedit для декодування стислих потоків даних у PDF.


4

PoDoFoBrowser - це маленька безкоштовна портативна утиліта, яка дозволяє не лише переглядати внутрішню структуру PDF, а й експортувати, імпортувати та редагувати дані об’єктів. Завантажити його можна звідси:

http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/

Ось як це виглядає під Windows:

скріншот


2

У вільному редакторі PDF-XChange є панель " Зміст ", яка дозволяє переглядати структуру дерева файлу PDF.

View -> Panes -> Content

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.