Як отримати скріншот найкращої якості для OCR (оптичне розпізнавання символів)?


2

Я намагаюся отримати деякі дані у текстовий файл із скріншотів. Мабуть, скріншоти не дуже добре працюють з OCR, оскільки вони 75dpi, а мінімум для хорошої якості OCR - 150 dpi. Хтось знає хороший спосіб зробити скріншоти для OCR?

Зараз я отримую досить хороші результати з безкоштовними онлайн-інструментами, такими як new-ocr, але це робить помилки, які мені доводиться виправляти раз у раз. Тому я хотів би отримати кілька порад. Я також протестував скріншот ABBYY, і це було досить погано ... онлайн-інструменти краще.


Я використовую зчитувач скріншотів ABBYY, і він прекрасно працює для мене. Я щойно перевірив це знову на власне запитання. Цікаво, чи ваші завдання чомусь особливо складні.
texnic

Відповіді:


1

Станом на 21 червня 2011 року ви можете використовувати Google Docs для скріншотів OCR у пакетній партії.

Ви можете завантажити папку із зображеннями та перетворити їх у Документи, які містять як зображення, так і текст OCRed.

Потім ви можете завантажити всі ці документи у вигляді звичайного тексту, що викреслить зображення.

Якщо на ваших знімках екрана є унікальні назви файлів, їх слід тривіально пов’язати з текстом OCRed майже в будь-якій системі.


4

Нещодавно у мене була подібна потреба (не для скріншота, а факсимільної сторінки). Ocrterminal.com зробив чудову роботу, це швидко і безкоштовно для певної кількості конверсій на місяць (я думаю, 20?). Друг використовує Tesseract , який заснований на командному рядку і, здається, працює добре.


Я використовував newocr.com, який також швидко та безкоштовно. Це спрацювало добре, але там було багато помилок, які мені довелося виправити. Ну добре, я не можу бути жадібним, річ насправді фотографується та перетворюється на текст hehe ...
GiH

1

ScreenOCR (21-денний пробний період) стверджує, що добре робити роботу із скріншотами (що допомагає вам робити). Я ще не пробував цього.


0

Я б припустив, що тому, що на знімках екрана використовується шрифт, а не рукописний текст у 75dpi, це не так вже й погано.


ви здивуєтеся іноді, це зовсім не відповідає
GiH

0

Я використовую GreenShot для кришок екрана


1
говорити про OCR ...
GiH

Так, я не був впевнений, оскільки друга частина питання була дещо неоднозначною;) дякую за оновлення, щоб уточнити.
Шевек
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.