Акт вилучення тексту з зображень називається, OCR
і Ubuntu має вікі-сторінку, присвячену OCR . З цієї сторінки:
Наявні засоби OCR
Репозиторії Ubuntu Universe містять такі інструменти OCR:
- gocr - командний рядок OCR
- fuzzyocr - плагін spamassassin для перевірки вкладених зображень
- libhocr0 - іврит OCR
- ocrad - програма оптичного розпізнавання символів
- ocrfeeder - Аналіз макета документа та система оптичного розпізнавання символів
- ocropus - аналіз документів та система OCR
- tesseract-ocr
Універсальні репозиторії Ubuntu також містять:
- клинопис - багатомовна система OCR
Деякі пакети застарілі, але неофіційні свіжі можна знайти в Alex_P PPA (код додавання PPA: ppa: alex-p / notesalexp). Якщо ви ніколи не використовували PPA, перевірте, як додати програмне забезпечення з PPA .
редагувати: Як показано в коментарі, Клара OCR також існує, але вона отримала стук у Харді, і на їхньому веб-сайті було оновлено 2009 рік.