0
Як стиснути PDF-файли, кодовані Tesseract, зберігаючи вбудований текст з OCR?
Я експериментував із використанням Tesseract для OCR моїх PDF-файлів, і це було успішно, особливо з текстами німецької фрактури (готичний друк старого стилю), які такі інструменти, як Adobe Acrobat, не можуть розпізнати належним чином. Проблема полягає в тому, що вихідні файли Tesseract досить великі, і я хочу їх стиснути після OCRing. …