Як індексувати PDF-документ?


11

Я читаю документ PDF в Ubuntu 11.04, використовуючи за замовчуванням "Переглядач документів". Документ містить понад 500 сторінок, і потрібен певний час, щоб заповнити "Знайти ..." для певного тексту. Чи є спосіб індексувати PDF-документи на вищезгаданій платформі? Я шукаю функціонал, вбудований у сам читач.

Відповіді:


1

Я не впевнений, що хтось із читачів PDF підтримує індексацію тексту - можливо, тому що саме індексація буде досить дорогою, а файли pdf відкриваються та закриваються "ad-hoc"

Однак я провів тестування і можу побачити, що окуляр - переглядач за замовчуванням від KDE - має набагато швидший пошук, ніж евісті (переглядач за замовчуванням від Ubuntu). Тобто, для того, щоб окуляр міг просканувати весь документ на 500 сторінок, це може зайняти секунду, в той час як evince витрачає ~ 5 сек на те саме завдання.

Ви можете встановити його, ввівши

sudo apt-get install okular 

(або просто шукайте його в Програмному центрі )

якщо це перша програма KDE на вашій машині, вона потребує встановлення зовсім небагато залежностей, але це, можливо, варто того - я знаходжу програми KDE, як правило, більш здатні, ніж їх аналоги Gnome ... Okular підтримує PDF-анотації, для приклад, який також іноді корисний.


Сергій - я використовую гном. Як ви вже згадували, також потрібно встановити багато залежностей від kde. Наскільки ризиковано встановити залежності kde? Я не хочу потрапляти в проблеми знову встановити всю ОС. Дякую за допомогу.
Praveen Sripati

Це так само ризиковано, як переходити дорогу - мільйони людей роблять це щодня, але добре, є невеликий шанс, що щось може піти не так - як і при встановленні будь-якого іншого програмного забезпечення. Насправді, я думаю, це навіть абсолютно нормально одночасно встановлювати настільні ПК Gnome, KDE та XFCE та перемикатися між ними ...
Сергій

Дякую Сергію - Окуляр крутий - функція анотацій дуже приємна.
Praveen Sripati

@PraveenSripati, якщо вас турбують залежності Okular, ви можете спробувати qpdfview. Прошу побачити мою відповідь нижче для отримання більш детальної інформації.
Glutanimate

3

Tracker може індексувати ваші PDF-документи. Це дуже швидко і надійно.

Якщо ви ще не використовуєте цей чудовий інструмент, ви можете налаштувати його на індексацію лише своїх PDF-документів: Alt+ F2потім вставте tracker-preferencesперейдіть до пункту «Місцеположення» та виберіть папку вашого PDF.


1

Інший переглядач PDF


Огляд

Дуже легкою та швидкою альтернативою Okular, яка не має жодної з KDE-залежностей, є qpdfview . Він все ще знаходиться в бета-версії, але я виявив, що він такий же стабільний, як і його великі партнери. Результативність пошуку є фантастичною і принаймні нарівні з Okular.

Установка

Qpdfview ist ще не доступний в офіційних сховищах, але його можна легко встановити з PPA розробника, ввівши:

sudo add-apt-repository ppa:b-eltzner/qpdfview && apt-get update
sudo apt-get install qpdfview

Індексація PDF


Огляд

Мені не вдалося знайти альтернативу можливостям індексації Adobe Acrobat в Linux, але, здається, це тому, що вбудовані індекси все ще не є частиною відкритих стандартів PDF .

Однак існує ряд дуже потужних настільних пошукових систем, які є швидшими та ефективнішими в індексації PDF, ніж фірмові інструменти Adobe. Про Tracker вже згадувалося, але там також є інші додатки. Ви можете знайти дуже ретельне порівняння тут .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.