Можливі дублікати:
Вилучення тексту з відсканованої книги .PDF
Як зробити OCR на PDF документі?
У мене з'явилося керівництво у форматі PDF у розмірі 200 сторінок, яке було створено шляхом сканування копії. Я хотів би перетворити його на текстовий формат для пошуку, але я не маю жодного успіху в пошуку інструменту для цього. Результати пошуку Google дуже забруднені, тому що випробувальне програмне забезпечення, яке використовує криптові програми, може робити лише перші кілька сторінок файлу. Єдине дійсно безкоштовне додаток, яке я знайшов, FreeOCR PDF рендеринга не вдається обробляти нічого за перші кілька сторінок файлу.
PDF-переглядач Google робить OCR; але не надає жодної опції експорту, крім копіювання / вставки; на додаток до того, що він дуже нудний, те, що він поміщає в буфер обміну, є лише відкритим текстом; це означає, що я втрачу всі лінії мистецтва і значне форматування через горизонтальне розміщення.