Evernote робить OCR на збережених на них зображеннях. Чи є спосіб отримати повноцінний еквівалент тексту для зображення в Evernote, або OCR є лише для пошуку?
Evernote робить OCR на збережених на них зображеннях. Чи є спосіб отримати повноцінний еквівалент тексту для зображення в Evernote, або OCR є лише для пошуку?
Відповіді:
API Evernote має функцію отримання тексту та прямокутника там, де цей текст присутній всередині зображення. Див. Http://evernote.com/about/developer/api/evernote-api.htm , перегляньте "Індекс розпізнавання Evernote XML Format" та функції для його отримання. Проблема в тому, що вони не роблять традиційні OCR ... їх алгоритм OCR може створювати різні слова для одного "слова" на зображенні. Все, що вони використовують для цього, - це пошук, тому це добре для них, але не чудово, щоб використовувати його як двигун розпізнавання. (Хоча вони дають вагу кожному альтернативному слову, тож, можливо, ви можете використовувати це)
Крім того, Evernote, мабуть, не вирішує, що певне зображення еквівалентне точно одному слову - наприклад, Evernote не визначає, що певне зображення є "підказкою" і не є "належним". Швидше, це буде відслідковувати і те, і інше, і пошук обох повертає однакове зображення. Отже, немає способу отримати повнотекстовий еквівалент, оскільки Evernote не вирішує, що насправді є повним текстом, а лише яким він може бути.
evernote виплачує гідну суму творцеві ocr-речі АБО заплатив пристойну суму, щоб укласти щось спільне. таким чином, я дуже сумніваюся, що вони дозволять вам отримати витягнутий текст (+ розміщення на зображенні).
(Можливо, це бізнес-модель, для сканування зображень інших людей та надання хорошої якості :))
отже, відповідь: ні.
Я не впевнений, скільки вишуканості вам потрібно, але оскільки я також використовую Adobe Acrobat, я просто клацніть правою кнопкою миші на моєму вкладенні Evernote, щоб відкрити програму Acrobat.
Потім зсередини Acrobat я вибираю "Документ | Розпізнавання тексту OCR", а потім зберігаю документ як звичайний текст.
Це добре працює для мене, оскільки мені потрібна лише епізодична конверсія OCR.
Якщо ви могли отримати всі зображення з Evernote, ви можете зробити OCR за допомогою Документів Google.
Ви можете завантажити папку з зображеннями в Документи Google і перетворити їх у Документи, які містять як зображення, так і текст OCRed.
Потім ви можете завантажити всі ці документи у вигляді звичайного тексту, що викреслить зображення.
Якщо ви називаєте всі зображення Evernote хешем (напр. md5
), Слід зв'язати звичайні текстові файли, завантажені з Документів Google, з оригінальним зображенням.
Я в Windows і використовую Adobe Acrobat Pro та Word, тому я роблю наступне: