13
обробка зображення для поліпшення точності тессеракта OCR
Я використовував tesseract для перетворення документів у текст. Якість документів дико коливається, і я шукаю поради щодо того, яка обробка зображень може покращити результати. Я помітив, що дуже сильно піксельний текст - наприклад, створений факс-машинами - особливо важко обробляти tesseract - імовірно, всі ці зазубрені краї символів змішують алгоритми розпізнавання …