Витягніть текст OCR з Evernote


13

Evernote робить OCR на збережених на них зображеннях. Чи є спосіб отримати повноцінний еквівалент тексту для зображення в Evernote, або OCR є лише для пошуку?

Відповіді:


15

API Evernote має функцію отримання тексту та прямокутника там, де цей текст присутній всередині зображення. Див. Http://evernote.com/about/developer/api/evernote-api.htm , перегляньте "Індекс розпізнавання Evernote XML Format" та функції для його отримання. Проблема в тому, що вони не роблять традиційні OCR ... їх алгоритм OCR може створювати різні слова для одного "слова" на зображенні. Все, що вони використовують для цього, - це пошук, тому це добре для них, але не чудово, щоб використовувати його як двигун розпізнавання. (Хоча вони дають вагу кожному альтернативному слову, тож, можливо, ви можете використовувати це)


11

Крім того, Evernote, мабуть, не вирішує, що певне зображення еквівалентне точно одному слову - наприклад, Evernote не визначає, що певне зображення є "підказкою" і не є "належним". Швидше, це буде відслідковувати і те, і інше, і пошук обох повертає однакове зображення. Отже, немає способу отримати повнотекстовий еквівалент, оскільки Evernote не вирішує, що насправді є повним текстом, а лише яким він може бути.


5

evernote виплачує гідну суму творцеві ocr-речі АБО заплатив пристойну суму, щоб укласти щось спільне. таким чином, я дуже сумніваюся, що вони дозволять вам отримати витягнутий текст (+ розміщення на зображенні).

(Можливо, це бізнес-модель, для сканування зображень інших людей та надання хорошої якості :))

отже, відповідь: ні.


3
Це неправда. Існує API для отримання саме цієї інформації. Дивіться мою відповідь.
Peter Štibraný

2

Я не впевнений, скільки вишуканості вам потрібно, але оскільки я також використовую Adobe Acrobat, я просто клацніть правою кнопкою миші на моєму вкладенні Evernote, щоб відкрити програму Acrobat.

Потім зсередини Acrobat я вибираю "Документ | Розпізнавання тексту OCR", а потім зберігаю документ як звичайний текст.

Це добре працює для мене, оскільки мені потрібна лише епізодична конверсія OCR.


1

Якщо ви могли отримати всі зображення з Evernote, ви можете зробити OCR за допомогою Документів Google.

Ви можете завантажити папку з зображеннями в Документи Google і перетворити їх у Документи, які містять як зображення, так і текст OCRed.

Потім ви можете завантажити всі ці документи у вигляді звичайного тексту, що викреслить зображення.

Якщо ви називаєте всі зображення Evernote хешем (напр. md5), Слід зв'язати звичайні текстові файли, завантажені з Документів Google, з оригінальним зображенням.


0

Я в Windows і використовую Adobe Acrobat Pro та Word, тому я роблю наступне:

  1. якщо файл не збережено у форматі JPG, тоді натисніть значок очного яблука у верхньому лівому куті зображення в Evernote, щоб відкрити його у програмі перегляду фотографій, та натисніть Файл> «Зробити копію», щоб зберегти його як JPG
  2. перейдіть до файлу зображень у Провіднику
  3. клацніть по ньому правою кнопкою миші та оберіть Перетворити в Adobe PDF (файл відкриється в Acrobat)
  4. натисніть «Файл»> «Зберегти як» та виберіть формат розширеного тексту у спадному меню «Зберегти як тип», щоб зберегти як текстовий файл із розширеним текстом (обробка файлу займає хвилину)
  5. перейдіть до файлу RTF у Провіднику та двічі клацніть, щоб відкрити в Word
  6. редагуйте за потребою

Здається, це порада щодо того, як витягти текст із заданого файлу зображень, а не зображення в Evernote. Чи можете ви пояснити, як це відповідає на початкове запитання, і чи робить це таким чином, що попередня та прийнята відповідь не відповідає?
music2myear
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.