OCR з немовним текстом


3

Я зацікавлений у розпізнаванні тексту з документа, який не містить слів. Швидше, це документ з довгим рядком "випадкових" друкованих символів. Я намагався використовувати tesseract для сканування тексту, але, схоже, шукаю слова. Чи є спосіб сказати tesseract просто зробити просте розпізнавання символів?


Я оновив запитання, щоб виправити скаргу.
Daniel

Старий Presto! PageManager, що надійшов зі сканером, не виконував перевірку правопису за промовчанням (windows), він має перевірку орфографії, але розпізнає OCR. Цікаво, якщо ви можете зникнути словник на будь-якому програмному забезпеченні, що робить автоматичну корекцію, це не могло зробити це тоді. OCR за замовчуванням не переглядає цілі слова, окрім mabey для вирівнювання.
Psycogeek

1
@Daniel - Тепер його питання, на яке насправді можна відповісти.
Ramhound

Відповіді:


2

Так, ти можеш відключити словники визначаючи файл конфігурації, що містить:

load_system_dawg F
load_freq_dawg F

і вкажіть команду.


Це, здається, робить те, що я хотів. На жаль, результати не набагато кращі для тексту, з яким я працював, але він відповідає на це питання. Дякую!
Daniel
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.