Я бачив кілька електронних книг / паперів, які, очевидно, відскановані з їх паперових версій, але текст у електронних книгах / паперах можна дивно скопіювати. Я вважаю, що версії, що безпосередньо скануються, повинні бути оброблені деяким програмним забезпеченням для оптичного розпізнавання символів.
Тож я хотів би дізнатися, які рекомендовані програмні засоби оптичного розпізнавання символів? Особливо тих, які або для Ubuntu, або безкоштовно? Якщо такі для Windows набагато досконаліші, будь ласка, повідомте мене також про це.
Мене особливо цікавлять ті OCR, які можуть прийняти відсканований pdf-файл як вхідний і все ще видають як вихід інший pdf-файл, який виглядає так само, як вхідний, але з текстом, який можна скопіювати.
Дякую та з повагою!
Будь ласка, обмежте одне програмне забезпечення на відповідь