Запитання з тегом «tesseract-ocr»

1
OCR з немовним текстом
Я зацікавлений у розпізнаванні тексту з документа, який не містить слів. Швидше, це документ з довгим рядком "випадкових" друкованих символів. Я намагався використовувати tesseract для сканування тексту, але, схоже, шукаю слова. Чи є спосіб сказати tesseract просто зробити просте розпізнавання символів?

0
Як стиснути PDF-файли, кодовані Tesseract, зберігаючи вбудований текст з OCR?
Я експериментував із використанням Tesseract для OCR моїх PDF-файлів, і це було успішно, особливо з текстами німецької фрактури (готичний друк старого стилю), які такі інструменти, як Adobe Acrobat, не можуть розпізнати належним чином. Проблема полягає в тому, що вихідні файли Tesseract досить великі, і я хочу їх стиснути після OCRing. …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.