Як шукати та виділяти довгі уривки у файлі PDF?


2

Я зробив кілька важливих моментів на Kindle Touch у файлах PDF. Kindle зберігає виділений текст в окремому файлі, а не в самих PDF-файлах. У мене є весь текст уривків, які я хочу висвітлити, що мені потрібно: програма, яка може знайти довгі фрази, а потім виділити ці фрази. Таким чином, я можу створити макрос для цієї програми для циклу та зробити це для всіх моїх текстових уривків.

Я спробував Adobe Acrobat XI, але в Acrobat є обмеження щодо кількості слів, які я можу шукати (~ 28 символів). Я знаю, що міг би розділити основні моменти, але мені важливо цього не робити. Отже, мої запитання:

  1. Чи є програмне забезпечення, яке може це зробити? (Шукайте довгий рядок і, знайшовши його, виділіть його та збережіть модифікований PDF?)

  2. У Acrobat є консоль JavaScript, може хто-небудь, хто є кмітливим, запропонує мені сценарій для цього? (Я можу кодувати дуже базовий Python, але немає Java / JavaScript)

Я на Windows 7 Ultimate x64

Дякую!


Для вирішення проблеми можна використовувати інструмент Redaction, можливо, за допомогою спеціальних регулярних виразів (ви можете налаштувати в Acrobat, але це трохи хак), а потім замінити анотації Redaction на звичайні анотації Highlight. Крім того, ви можете використовувати Redax від Appligent, що дозволяє додавати регулярні вирази через інтерфейс користувача.
Макс Вісс

Дякую за пропозицію! Ваше рішення має перевагу в тому, що дозволяє шукати 256 символів, але не більше: / принаймні, це я знайшов під час пошуку редакцій. Хоча це вже вдосконалення, я хотів щось, що дозволить зробити повний пошук абзацу (> 400 символів), або, в ідеалі, без обмежень для символів
flen

Відповіді:


0

Adobe Acrobat PRO X має можливість додати дію, яка викликається виділенням. Він використовує параметр виділення та редагування, але замість редагування знайденого тексту замінює його для виділення. Я спробував це з файлом Kindle clippings.txt, і він працює як шарм. Я ненавиджу ADOBE, тому намагаюся знайти подібне рішення для іншого читача PDF.

Двоє хлопців підготували AppleScript для зчитувача файлів PDF для MAC OS X Skim (який я люблю), але я не зміг змусити їх працювати. Я вивчу це можливе рішення в іншому питанні. Файл Action для ADOBE має розширення. Я зараз не можу його знайти в Google, але я знаю, що він є. На жаль, я перейменував файл, тому не можу точно вказати на його джерело.

Про проекти GitHub для Skim див

мій-вирізки-до-pdf

Skim-AppleScript


Дякую, але я користувач Windows ... Я тим часом дізнався JS-API Javascript та Acrobat і написав собі сценарій для Acrobat Pro XI, який можу це зробити. Це потребує певного полірування, і я зараз дуже зайнятий, але в наступні місяці я маю намір поставити його тут. Якщо ви зацікавлені, надішліть мене, і я передам вам попереджувальну версію (це може шукати лише необмежений текст на певній сторінці (тобто, якщо текст розтягнеться на 2 і більше сторінок, він не знайде його), але буду шукати всі сторінки. Мені потрібно вдосконалити його, щоб зняти це обмеження)
flen
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.