Як можна витягнути текст із зображень?

Я говорю не про відскановані файли, а про зображення садових сортів, наприклад, коли ви робите висококласні зображення дошки на уроці, і це добре написано від руки; або коли ви фотографуєте сторінку з книги рецептів і бажаєте рецепт у текстовому форматі.

Будь-яке вільне та відкрите програмне забезпечення для цього?

Я спробував tesseract, і результати були жахливі.

software-recommendation images ocr

— Страпаковський
джерело

Мені потрібен OCR, який одночасно підтримує бенгальську та англійську мови.

— alhelal

Відповіді:

Акт вилучення тексту з зображень називається, OCRі Ubuntu має вікі-сторінку, присвячену OCR . З цієї сторінки:

Наявні засоби OCR

Репозиторії Ubuntu Universe містять такі інструменти OCR:

gocr - командний рядок OCR
fuzzyocr - плагін spamassassin для перевірки вкладених зображень
libhocr0 - іврит OCR
ocrad - програма оптичного розпізнавання символів
ocrfeeder - Аналіз макета документа та система оптичного розпізнавання символів
ocropus - аналіз документів та система OCR
tesseract-ocr

Універсальні репозиторії Ubuntu також містять:

клинопис - багатомовна система OCR

Деякі пакети застарілі, але неофіційні свіжі можна знайти в Alex_P PPA (код додавання PPA: ppa: alex-p / notesalexp). Якщо ви ніколи не використовували PPA, перевірте, як додати програмне забезпечення з PPA .

редагувати: Як показано в коментарі, Клара OCR також існує, але вона отримала стук у Харді, і на їхньому веб-сайті було оновлено 2009 рік.

— Rinzwind
джерело

Чи є у вас досвід використання будь-якого з цих прикладів, які я описав? Я став трохи скептично ставитись до звичайних інструментів ocr для них. Число 7 у списку - це те, що я спробував, і було явно жахливо.

— Страпаковський

Якщо я пам'ятаю, я спробував також gocr, з рівноцінними жахливими результатами. Якщо ви успішно спробували будь-який із них, який синтаксис ви використовували? Спасибі.

— Страпаковський

Нічого! Я ніколи не переймався OCR: D Пошук

— свіжого м’яса

Чи помиляюсь, якщо кажу, що для успішного використання OCR потрібні знання процесу та ретельна настройка, щоб відповідати конкретному зображенню, яке потрібно сканувати? Таким чином, якщо я маю рацію, погані результати можуть бути наслідком користувача, а не програмного забезпечення.

— NN

OCRНайкраще працює, якщо ви знаєте, як створюється зображення, і ви дуже добре розбираєтесь у використанні програмного забезпечення, яке ви використовуєте (останнє є причиною того, що я ніколи не замислювався над його використанням).

— Rinzwind

tesseract-ocrбуло б чудовим порівняно з усіма іншими. Для встановлення запустіть команду sudo apt-get install tesseract-ocr.

Використання є tesseract filename.jpg output.txt.

Вище команда генерує output.txt.

Ви можете подумати про вибір відповідної мови. У такому випадку вам потрібно буде встановити tesseract-ocr-LANGпакет, де LANGє трибуквенний код мови ISO 639-2 . Зараз у вас є 123 мови на 18.04 репо. Потім використовуйте, наприклад:

tesseract mySpanishText.jpg output -l spa

— Судхір Белагалі
джерело

Гей, значить, це працює, але не точно, або я б сказав, що це 80-85%. Як приклад для цього зображення: pbs.twimg.com/media/DJs6_pcXkAA2VrN.jpg , воно зіпсувало знак $ і також більшість дужок. Квадратні, круглі, фігурні, всі дужки - це проблема, вони ніколи не отримуються належним чином. Чи знаєте ви якісь виправлення?

— Мілан Чхеда