PDF-файл на основі OCR-зображення [дублікат]


2

Можливі дублікати:
Вилучення тексту з відсканованої книги .PDF
Як зробити OCR на PDF документі?

У мене з'явилося керівництво у форматі PDF у розмірі 200 сторінок, яке було створено шляхом сканування копії. Я хотів би перетворити його на текстовий формат для пошуку, але я не маю жодного успіху в пошуку інструменту для цього. Результати пошуку Google дуже забруднені, тому що випробувальне програмне забезпечення, яке використовує криптові програми, може робити лише перші кілька сторінок файлу. Єдине дійсно безкоштовне додаток, яке я знайшов, FreeOCR PDF рендеринга не вдається обробляти нічого за перші кілька сторінок файлу.

PDF-переглядач Google робить OCR; але не надає жодної опції експорту, крім копіювання / вставки; на додаток до того, що він дуже нудний, те, що він поміщає в буфер обміну, є лише відкритим текстом; це означає, що я втрачу всі лінії мистецтва і значне форматування через горизонтальне розміщення.


@DanielAndersson На жаль, ніхто з них не був корисним. Вибухання файлу на сотні зображень, а потім склеювання їх разом, було б величезною втратою часу (1-а і 3-я ланка). Я вже маю багато інструментів, які стверджують, що вони б виконували роботу, якщо я дав їм гроші, але які не можу перевірити, тому що проблемні частини файлу не відповідають тому, що вони роблять безкоштовно (2 посилання)
Dan Neely

Потім покладіть цю інформацію на ваше питання, щоб люди знали, що ви намагалися, а не. Люди не знаходяться на цьому сайті, оскільки їм подобається вгадати :-)
Daniel Andersson

Відповіді:


2

Якщо ви завантажуєте свій PDF-файл у Диск Google (Документи), а для перетворення параметрів конвертації зображень у текст, а потім перетворюєте документ у документ Google (це можна зробити під час завантаження). Потім ви зможете відкрити документ, натисніть файл & gt; завантажити як і вибрати потрібний формат?

Я тільки що зробив це сторінка журналу, і вона працювала нормально, не всі шрифти були визнані.


Максимальний розмір конвертера завантаження становить 2 Мб файлу. Якщо я імпортую його електронною поштою до себе (що я намагався спочатку), я не стикаюся з обмеженням; але не отримуйте опції конверсії.
Dan Neely

Як щодо цієї послуги? Він каже, що він не має обмежень на завантаження? newocr.com
sgtbeano

Це служба роду робіт; але, розбиваючи все, що не є літером, він порушує помірну кількість форматування (найбільш серйозно деякі структурні формули для хімікатів).
Dan Neely

Я використав PDF-роздільник, щоб скоротити файл нижче межі завантаження; але перетворювач GoogleDoc взагалі не розпізнав текст; на відміну від того, що робить їх переглядач PDF.
Dan Neely
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.