PDF у текстовий перетворювач [закрито]


9

Я шукаю спосіб "одним клацанням" взяти будь-який PDF та перетворити його у звичайний текст. В ідеалі на OSX або Linux.

В ідеалі рішення включало б функціональність OCR, але це не обов'язково.

Основним пріоритетом є те, що може приймати будь-який файл БЕЗ конфігурації.

Відповіді:


23

Є xpdf, який включає pdftotextдвійковий файл.

Pdftotext перетворює файли формату портативного документа (PDF) у звичайний текст.

У Linux доступний інсталятор. Здається, що він також поставляється в poppler-utilsупаковці. В OS X ви можете встановити його за допомогою Homebrew (встановити спочатку), а потім використовувати

brew install homebrew/x11/xpdf

який буде завантажувати вихідні файли та компілювати їх для OS X. Після цього просто використовуйте його так:

pdftotext your_pdf_file.pdf

який генерує звичайний текстовий файл. Також є кілька варіантів, ознайомтеся з man pdftotextдокладною інформацією.

Альтернатива - poppler , в OSX:

brew install poppler

в Debian та друзів

apt-get install poppler-utils

станом на сьогодні командаbrew install homebrew/x11/xpdf
Дієго Вієйра

1
@DiegoVieira Дякую Наступного разу не соромтеся запропонувати зміни!
slhck

якась перевага використання poppler замість xpdf / pdftotext?
Гонсало Бахамонджес

brew install Caskroom/cask/pdftotext
Гюго

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.