Нещодавно я зіткнувся з Tesseract та OpenCV . Схоже, Tesseract - це повноцінний механізм OCR, і OpenCV може бути використаний як основа для створення програми / послуги OCR.
Я спробував використовувати Tesseract на деяких своїх зображеннях, і його точність видається пристойною. Пізніше я натрапив на дуже простий підручник з використання OpenCV для виконання OCR за допомогою Python і був вражений. За кілька хвилин я закінчив навчання системі, і її точність була хорошою. Але, звичайно, такий підхід означає, що мені потрібно широко тренувати свою систему, використовуючи великий навчальний набір.
Мої конкретні запитання такі:
- Як вибрати між Tesseract та використанням OpenCV для створення власної програми OCR?
- Для Tesseract доступні набори навчальних даних для різних мов. Чи є у OpenCV щось подібне, щоб мені не довелося починати грунтову роботу для досягнення OCR?
- Який із них краще для комерційного застосування?
Будь-які пропозиції?