Витягніть текст OCR з Evernote

13

Evernote робить OCR на збережених на них зображеннях. Чи є спосіб отримати повноцінний еквівалент тексту для зображення в Evernote, або OCR є лише для пошуку?

ocr evernote

— Лей Ріффель
джерело

15

API Evernote має функцію отримання тексту та прямокутника там, де цей текст присутній всередині зображення. Див. Http://evernote.com/about/developer/api/evernote-api.htm , перегляньте "Індекс розпізнавання Evernote XML Format" та функції для його отримання. Проблема в тому, що вони не роблять традиційні OCR ... їх алгоритм OCR може створювати різні слова для одного "слова" на зображенні. Все, що вони використовують для цього, - це пошук, тому це добре для них, але не чудово, щоб використовувати його як двигун розпізнавання. (Хоча вони дають вагу кожному альтернативному слову, тож, можливо, ви можете використовувати це)

— Петро Штібрані
джерело

11

Крім того, Evernote, мабуть, не вирішує, що певне зображення еквівалентне точно одному слову - наприклад, Evernote не визначає, що певне зображення є "підказкою" і не є "належним". Швидше, це буде відслідковувати і те, і інше, і пошук обох повертає однакове зображення. Отже, немає способу отримати повнотекстовий еквівалент, оскільки Evernote не вирішує, що насправді є повним текстом, а лише яким він може бути.

— Майк Данхем
джерело

5

evernote виплачує гідну суму творцеві ocr-речі АБО заплатив пристойну суму, щоб укласти щось спільне. таким чином, я дуже сумніваюся, що вони дозволять вам отримати витягнутий текст (+ розміщення на зображенні).

(Можливо, це бізнес-модель, для сканування зображень інших людей та надання хорошої якості :))

отже, відповідь: ні.

— акіра
джерело

3

Це неправда. Існує API для отримання саме цієї інформації. Дивіться мою відповідь.

— Peter Štibraný

2

Я не впевнений, скільки вишуканості вам потрібно, але оскільки я також використовую Adobe Acrobat, я просто клацніть правою кнопкою миші на моєму вкладенні Evernote, щоб відкрити програму Acrobat.

Потім зсередини Acrobat я вибираю "Документ | Розпізнавання тексту OCR", а потім зберігаю документ як звичайний текст.

Це добре працює для мене, оскільки мені потрібна лише епізодична конверсія OCR.

— Брюс Кессел
джерело

1

Якщо ви могли отримати всі зображення з Evernote, ви можете зробити OCR за допомогою Документів Google.

Ви можете завантажити папку з зображеннями в Документи Google і перетворити їх у Документи, які містять як зображення, так і текст OCRed.

Потім ви можете завантажити всі ці документи у вигляді звичайного тексту, що викреслить зображення.

Якщо ви називаєте всі зображення Evernote хешем (напр. md5), Слід зв'язати звичайні текстові файли, завантажені з Документів Google, з оригінальним зображенням.

— Макс Маснік
джерело

0

Я в Windows і використовую Adobe Acrobat Pro та Word, тому я роблю наступне:

якщо файл не збережено у форматі JPG, тоді натисніть значок очного яблука у верхньому лівому куті зображення в Evernote, щоб відкрити його у програмі перегляду фотографій, та натисніть Файл> «Зробити копію», щоб зберегти його як JPG
перейдіть до файлу зображень у Провіднику
клацніть по ньому правою кнопкою миші та оберіть Перетворити в Adobe PDF (файл відкриється в Acrobat)
натисніть «Файл»> «Зберегти як» та виберіть формат розширеного тексту у спадному меню «Зберегти як тип», щоб зберегти як текстовий файл із розширеним текстом (обробка файлу займає хвилину)
перейдіть до файлу RTF у Провіднику та двічі клацніть, щоб відкрити в Word
редагуйте за потребою

— Піт Микола
джерело

Здається, це порада щодо того, як витягти текст із заданого файлу зображень, а не зображення в Evernote. Чи можете ви пояснити, як це відповідає на початкове запитання, і чи робить це таким чином, що попередня та прийнята відповідь не відповідає?

— music2myear