Відповіді:
Є xpdf, який включає pdftotext
двійковий файл.
Pdftotext перетворює файли формату портативного документа (PDF) у звичайний текст.
У Linux доступний інсталятор. Здається, що він також поставляється в poppler-utils
упаковці. В OS X ви можете встановити його за допомогою Homebrew (встановити спочатку), а потім використовувати
brew install homebrew/x11/xpdf
який буде завантажувати вихідні файли та компілювати їх для OS X. Після цього просто використовуйте його так:
pdftotext your_pdf_file.pdf
який генерує звичайний текстовий файл. Також є кілька варіантів, ознайомтеся з man pdftotext
докладною інформацією.
Альтернатива - poppler , в OSX:
brew install poppler
в Debian та друзів
apt-get install poppler-utils
brew install Caskroom/cask/pdftotext
Приємним інструментом для Windows є текстовий екстрактор A-PDF
brew install homebrew/x11/xpdf