OCR з немовним текстом

Я зацікавлений у розпізнаванні тексту з документа, який не містить слів. Швидше, це документ з довгим рядком "випадкових" друкованих символів. Я намагався використовувати tesseract для сканування тексту, але, схоже, шукаю слова. Чи є спосіб сказати tesseract просто зробити просте розпізнавання символів?

ocr tesseract-ocr

— Daniel
джерело

Я оновив запитання, щоб виправити скаргу.

— Daniel

Старий Presto! PageManager, що надійшов зі сканером, не виконував перевірку правопису за промовчанням (windows), він має перевірку орфографії, але розпізнає OCR. Цікаво, якщо ви можете зникнути словник на будь-якому програмному забезпеченні, що робить автоматичну корекцію, це не могло зробити це тоді. OCR за замовчуванням не переглядає цілі слова, окрім mabey для вирівнювання.

— Psycogeek

@Daniel - Тепер його питання, на яке насправді можна відповісти.

— Ramhound

Так, ти можеш відключити словники визначаючи файл конфігурації, що містить:

load_system_dawg F
load_freq_dawg F

і вкажіть команду.

— nguyenq
джерело

Це, здається, робить те, що я хотів. На жаль, результати не набагато кращі для тексту, з яким я працював, але він відповідає на це питання. Дякую!

— Daniel