PDF-файл на основі OCR-зображення [дублікат]

Можливі дублікати:
Вилучення тексту з відсканованої книги .PDF
Як зробити OCR на PDF документі?

У мене з'явилося керівництво у форматі PDF у розмірі 200 сторінок, яке було створено шляхом сканування копії. Я хотів би перетворити його на текстовий формат для пошуку, але я не маю жодного успіху в пошуку інструменту для цього. Результати пошуку Google дуже забруднені, тому що випробувальне програмне забезпечення, яке використовує криптові програми, може робити лише перші кілька сторінок файлу. Єдине дійсно безкоштовне додаток, яке я знайшов, FreeOCR PDF рендеринга не вдається обробляти нічого за перші кілька сторінок файлу.

PDF-переглядач Google робить OCR; але не надає жодної опції експорту, крім копіювання / вставки; на додаток до того, що він дуже нудний, те, що він поміщає в буфер обміну, є лише відкритим текстом; це означає, що я втрачу всі лінії мистецтва і значне форматування через горизонтальне розміщення.

pdf ocr

— Dan Neely
джерело

@DanielAndersson На жаль, ніхто з них не був корисним. Вибухання файлу на сотні зображень, а потім склеювання їх разом, було б величезною втратою часу (1-а і 3-я ланка). Я вже маю багато інструментів, які стверджують, що вони б виконували роботу, якщо я дав їм гроші, але які не можу перевірити, тому що проблемні частини файлу не відповідають тому, що вони роблять безкоштовно (2 посилання)

— Dan Neely

Потім покладіть цю інформацію на ваше питання, щоб люди знали, що ви намагалися, а не. Люди не знаходяться на цьому сайті, оскільки їм подобається вгадати :-)

— Daniel Andersson

Якщо ви завантажуєте свій PDF-файл у Диск Google (Документи), а для перетворення параметрів конвертації зображень у текст, а потім перетворюєте документ у документ Google (це можна зробити під час завантаження). Потім ви зможете відкрити документ, натисніть файл & gt; завантажити як і вибрати потрібний формат?

Я тільки що зробив це сторінка журналу, і вона працювала нормально, не всі шрифти були визнані.

— sgtbeano
джерело

Максимальний розмір конвертера завантаження становить 2 Мб файлу. Якщо я імпортую його електронною поштою до себе (що я намагався спочатку), я не стикаюся з обмеженням; але не отримуйте опції конверсії.

— Dan Neely

Як щодо цієї послуги? Він каже, що він не має обмежень на завантаження? newocr.com

— sgtbeano

Це служба роду робіт; але, розбиваючи все, що не є літером, він порушує помірну кількість форматування (найбільш серйозно деякі структурні формули для хімікатів).

— Dan Neely

Я використав PDF-роздільник, щоб скоротити файл нижче межі завантаження; але перетворювач GoogleDoc взагалі не розпізнав текст; на відміну від того, що робить їх переглядач PDF.

— Dan Neely