Як можна витягнути текст із зображень?


25

Як можна витягнути текст із зображень?

Я говорю не про відскановані файли, а про зображення садових сортів, наприклад, коли ви робите висококласні зображення дошки на уроці, і це добре написано від руки; або коли ви фотографуєте сторінку з книги рецептів і бажаєте рецепт у текстовому форматі.

Будь-яке вільне та відкрите програмне забезпечення для цього?

Я спробував tesseract, і результати були жахливі.


Мені потрібен OCR, який одночасно підтримує бенгальську та англійську мови.
alhelal

Відповіді:


26

Акт вилучення тексту з зображень називається, OCRі Ubuntu має вікі-сторінку, присвячену OCR . З цієї сторінки:

Наявні засоби OCR

Репозиторії Ubuntu Universe містять такі інструменти OCR:

  1. gocr - командний рядок OCR
  2. fuzzyocr - плагін spamassassin для перевірки вкладених зображень
  3. libhocr0 - іврит OCR
  4. ocrad - програма оптичного розпізнавання символів
  5. ocrfeeder - Аналіз макета документа та система оптичного розпізнавання символів
  6. ocropus - аналіз документів та система OCR
  7. tesseract-ocr

Універсальні репозиторії Ubuntu також містять:

  1. клинопис - багатомовна система OCR

Деякі пакети застарілі, але неофіційні свіжі можна знайти в Alex_P PPA (код додавання PPA: ppa: alex-p / notesalexp). Якщо ви ніколи не використовували PPA, перевірте, як додати програмне забезпечення з PPA .

редагувати: Як показано в коментарі, Клара OCR також існує, але вона отримала стук у Харді, і на їхньому веб-сайті було оновлено 2009 рік.


Чи є у вас досвід використання будь-якого з цих прикладів, які я описав? Я став трохи скептично ставитись до звичайних інструментів ocr для них. Число 7 у списку - це те, що я спробував, і було явно жахливо.
Страпаковський

Якщо я пам'ятаю, я спробував також gocr, з рівноцінними жахливими результатами. Якщо ви успішно спробували будь-який із них, який синтаксис ви використовували? Спасибі.
Страпаковський

Нічого! Я ніколи не переймався OCR: D Пошук
свіжого м’яса

Чи помиляюсь, якщо кажу, що для успішного використання OCR потрібні знання процесу та ретельна настройка, щоб відповідати конкретному зображенню, яке потрібно сканувати? Таким чином, якщо я маю рацію, погані результати можуть бути наслідком користувача, а не програмного забезпечення.
NN

OCRНайкраще працює, якщо ви знаєте, як створюється зображення, і ви дуже добре розбираєтесь у використанні програмного забезпечення, яке ви використовуєте (останнє є причиною того, що я ніколи не замислювався над його використанням).
Rinzwind

18

tesseract-ocrбуло б чудовим порівняно з усіма іншими. Для встановлення запустіть команду sudo apt-get install tesseract-ocr.

Використання є tesseract filename.jpg output.txt.

Вище команда генерує output.txt.

Ви можете подумати про вибір відповідної мови. У такому випадку вам потрібно буде встановити tesseract-ocr-LANGпакет, де LANGє трибуквенний код мови ISO 639-2 . Зараз у вас є 123 мови на 18.04 репо. Потім використовуйте, наприклад:

tesseract mySpanishText.jpg output -l spa

Гей, значить, це працює, але не точно, або я б сказав, що це 80-85%. Як приклад для цього зображення: pbs.twimg.com/media/DJs6_pcXkAA2VrN.jpg , воно зіпсувало знак $ і також більшість дужок. Квадратні, круглі, фігурні, всі дужки - це проблема, вони ніколи не отримуються належним чином. Чи знаєте ви якісь виправлення?
Мілан Чхеда
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.