Відповіді:
Виглядає безкоштовно, просто спробував, і це добре працює для мене.
Google Docs тепер тестує нову функцію API, яка використовує OCR (оптичне розпізнавання символів) на зображеннях та PDF-файлах.
В операційній системі Google :
API Google Docs тестує нову функцію, яка дозволяє виконувати OCR (оптичне розпізнавання символів) на зображенні. Там в демо , який ілюструє цю функцію : ви можете завантажити з високою роздільною здатністю JPG, GIF, PNG або зображення , яке має менше 10 МБ і Google Docs витягує текст і перетворює його в новий документ. Google згадує, що "ця операція може зайняти до 40 секунд", і невеликий тест показав, що сервіс ще не надійний: він повільний і часто повертає помилки.
Результати далеко не ідеальні, і ви знайдете багато помилок, але сервіс безкоштовний і постійно вдосконалюється. Ось результат OCR для цього відсканованого документа :
Документ Google Docs можна експортувати в різних форматах, включаючи HTML, OpenOffice та Word:
На мою відповідь на ТАК Чи хтось знає про спосіб програмного перетворення PDF у формат docx :
Перетворити PDF у SVG (ghostscript це зробить) та імпортувати, що ...
... справа в тому, що, хоча Word не вставить PDF, він вбудує SVG.
Використовуйте оптичну програму розпізнавання символів, наприклад, Omnipage Pro . Він підтримує PDF як введення документа та Word як вихід.
Ви також можете спробувати OCRTerminal, який пропонує безкоштовне обслуговування 20 сторінок на місяць. У них є бета-робочий клієнт, який, здається, доступний для використання за допомогою запрошення (ви повинні зв’язатися з ними та виявити інтерес).