Як шукати PDF-файли, використовуючи регулярні вирази?


15

Зазвичай я використовую Notepad ++ для пошуку у файлах (файлах), використовуючи регулярні вирази. Сьогодні мені цікаво, чи існує програма PDF, яка робить те саме для PDF-файлів. Звичайно, я міг перетворити PDF в текст і використовувати Notepad ++, але чи є більш простий спосіб без перетворення?


1
Яку ОС ви використовуєте?
Скотт Маккленінг

Попередній перегляд розробників Windows та Windows 7
Michael S.

Відповіді:


9

кілька варіантів:


1
@akira Що з Linux?
Нікхіл

4
  1. Агент Ransack безкоштовний (Lite) і підтримує PDF, як підтверджують його примітки до випуску.
  2. PowerGREP - комерційний продукт.

Як ви вже сказали, очевидною альтернативою є перетворення PDF-файлів у текст. Один із способів програміста налаштувати цю обробку для масової обробки - за допомогою пакету Python PDFMiner. Агент Ransack використовує "pdftotext" від проекту Xpdf (і ви теж можете).


sidenote: Агент Рансак - це легка версія FileLocator
акіра

Спасибі! Я придивився уважніше. Примітки до випуску постачальника підтверджують, що File Locator Lite aka Agent Ransack підтримує PDF. Редагування моєї відповіді.
мінопрет

Агент Рансак робить свою роботу. Ви також можете спробувати DnGrep.
Майкл С.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.