Переглядач метаданих PDF / редактор тегів для Ubuntu


26

Є багато запитань та відповідей щодо найкращого переглядача PDF-файлів, доступного в Ubuntu, але я хочу проаналізувати PDF-файл та знати деталі PDF, наприклад зображення, шрифти та посилання, які доступні у певному PDF-файлі.

Чи доступні переглядач метаданих PDF / редактори тегів?


2
Близькі виборці: Просто тому, що в цьому питанні "найкраще" в назві не виходить думка!
Сет

Відповіді:


31
  1. Перегляньте метадані pdf для файлу, званого Example.pdf:

    pdfinfo Example.pdf  
    
  2. Редагуйте наявні метадані в терміналі за допомогою наноредактора:

    pdftk Example.pdf dump_data output Metadata-output.txt
    nano Metadata-output.txt  
    
  3. Оновити метадані:

    pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
    

Комбінації клавіш редактора Nano
Використовуйте комбінацію клавіш Ctrl+ Oта після цього натисніть, Enterщоб зберегти файл у поточному місці.
Використовуйте комбінацію клавіш Ctrl+ Xдля виходу з нано.


10

Рішення CLI

Ще одна утиліта, на яку варто звернути увагу - exiftool . Перевага exiftool у порівнянні з pdfinfo полягає в тому, що він підтримує набагато більше типів метаданих (наприклад, теги XMP).

Ось приклад команди, яка буде друкувати всю наявну метаінформацію ( -a), відсортовану за групами ( -G1):

exiftool -a -G1 "$File"

Огляди підтримуваних тегів у форматі PDF:

Ви можете встановити exiftool на Ubuntu за допомогою:

sudo apt-get install libimage-exiftool-perl

GUI-рішення

Якщо ви шукаєте для перегляду / редактора метаданих PDF-графічного інтерфейсу, ви можете спробувати PDFMtEd . Це набір графічних утиліт, які я написав для управління метаданими PDF за допомогою exiftool:

введіть тут опис зображення

введіть тут опис зображення


1

Відповідь "найкращого" насправді залежить від того, наскільки детально ви хочете, і від того, наскільки стабільним ви хочете бути глядачем. Існує багато програмних засобів для перегляду та навіть редагування поштових скриптів та PDF-файлів у Linux; всі, які, здається, були видалені з поточних сховищ Ubuntu (можливо, через проблеми зі стабільністю).

Наразі рекомендую спробувати pdfedit. Якщо ви використовуєте Quantal або раніше, його можна встановити через

sudo apt-get install pdfedit

Для новіших випусків вам потрібно буде завантажити його зі сторінки проекту , розпакувати його і скласти самостійно.


Я не хочу глядача. Мені потрібен аналізатор, який може отримати деталі з pdf-файлу, як-от посилання, доступні у файлі .... зображення доступні ... індекс файлу тощо
Sahil Grover

Вибачте, pdftk плутають pdfedit через те, що вони видалили pdfedit із сховищ
virtualxtc

0

Щоб розробити pdftkметод редагування, що приємно, оскільки він показує вам все, що встановлено, одночасно дозволяє вам змінити все, що вам подобається, ось сценарій (для вашого .bashrcабо іншого файлу псевдонімів), щоб зробити це за допомогою однієї команди . Це створює нову версію файлу, який ви бажаєте відредагувати, відкриває ваш улюблений редактор з метаданими, а потім реалізує ваші зміни та встановлює час створення / модифікації файлу в модифікованому файлі PDF таким самим, як і в оригіналі. Щоб використовувати його, після ресурсу вашого .bashrcфайлу просто введіть

editPDFmetadata myfile.pdf

Ось псевдонім:

editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA  output $OUTPUT
touch -r ${1} ${OUTPUT}
}

Просто помістіть визначення вище у .bashrcфайл у своїй домашній папці, а потім відкрийте новий термінал, і він буде готовий до використання.


0

sudo apt-get install libimage-exiftool-perl

Метадані можна повністю видалити за допомогою наступної команди

exiftool -all:all= file_name

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.