Чи є безкоштовна бібліотека OCR для Android? [зачинено]


148

Я шукаю Java OCR, який працює на Android, однак Asprise, здається, не є платформою незалежної OCR. Чи є якийсь відкритий / безкоштовний Java OCR, який я можу використовувати для розробки додатків для Android?


9
Це питання слід повторно відкрити. Це дуже важливе і справедливе питання
Уцав Гупта,

5
Нещодавно Google випустив API OCR: developers.google.com/vision/text-overview
Wirling

Відповіді:


38

OCR може бути досить інтенсивним процесором, ви можете переглянути його на смарт-телефоні.

На мою думку, популярними бібліотеками OCR є Aspire та Tesseract . На Java також не виходить, так що ви не збираєтеся отримати вбудовану бібліотеку Android OCR.

Однак Tesseract є відкритим кодом (GitHub розміщував інфакт); тож ви можете приділити деякий час переносу потрібного підмножини на Java. Я розумію, що це не божевільний C ++, тому залежно від того, наскільки сильно вам потрібен OCR, це може коштувати часу.

Так коротка відповідь: Ні.

Довга відповідь: якщо ви готові працювати на це.


2
перенісши його, ви маєте на увазі перезапис підмножини на Java? це може зайняти багато зусиль, так що там немає 100% Java OCR?
користувач121196

13
Я рекомендую спробувати обернути Tesseract у шар JNI через Android NDK, а не намагатися перенести його на Java Android. Тессеракт вже здається перенесеним на ARM, тому слід було б легше поставити API JNI поверх нього. Крім того, це забезпечує швидкість (ер), ніж будь-який порт Java, і спростить довготривале обслуговування.
CommonsWare

15
Для Java вже є інтерфейс Tesseract JNI під назвою Tessjeract. code.google.com/p/tesjeract
sventechie

1
Tesseract не буде пішки від С до Яви. Код, який я бачив, дуже ідіоматичний 80-х років, і його не можна легко перенести на інші мови.
плінтус

2
@vincent зник за останній рік. Версія JNA тепер доступна: github.com/nguyenq/tess4j, а також вилка для Android: github.com/rmtheis/tess-two
sventechie

21

У мене дуже багато везіння tesseract-android


Питання закрите, але добре знайти того, хто мав позитивні результати. Дуже важко знайти людей на цих проектах типу джерела. Питання: чи ви пробували Tesseract із скануванням зображення паспортів або посвідчень документів? З текстовими PDF-файлами здається нормальним, але я борюся із зображеннями.
PKHunter

Я не пробував нічого, на якому були зображення, це був лише документ із текстом (той самий шрифт, шрифт, розмір)
Бен Пірсон,

Я сподіваюся, що це працює для мене
Romantic Electron

20

Іншим варіантом може бути розміщення зображення на веб-сайті (можливо, в більш пізній момент), а також його обробка OCR там без проблем із C ++ -> Java і, можливо, засміченням мобільного процесора.


Дуже гарна ідея: DI припускаю, що ви мали на увазі веб-сервіс (asmx) дякую
Omidoo


4

Так, є.

Але ОКР дуже величезна. Я знаю, що додаток для Android має функцію OCR, але це може бути не таким видом OCR, якого ви доглядаєте.

Ця програма з відкритим кодом називається Aedict , і вона робить OCR на японських рукописних символах. Це не так повільно.

Якщо це не те, що ви шукаєте, уточніть, який тип символів та введення даних (зображення чи історія дотику XY).


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.