Я думаю, що вашим найкращим підходом було б перетворити PDF на зображення з гідною роздільною здатністю, а потім порівняти зображення.
Для створення зображень з PDF-файлів ви можете використовувати Adobe PDF Library або рішення, запропоноване в найкращому варіанті для перетворення PDF-файлів у tiff-файли .
Для порівняння сформованих файлів TIFF я знайшов GNU tiffcmp (для Windows частина GnuWin32 tiff ) та tiffinfo добре зробили. Використовуйте tiffcmp -l і підраховуйте кількість рядків виводу, щоб знайти будь-які відмінності. Якщо ви раді, що невелика кількість змін вмісту (наприклад, згладжування різниць), використовуйте tiffinfo для підрахунку загальної кількості пікселів, і тоді ви зможете створити значення процентної різниці.
До речі, для тих, хто робить просте порівняння PDF, де структура не змінилася, можна використовувати командний рядок diff і ігнорувати певні шаблони, наприклад, з GNU diff 2.7:
diff --brief -I xap: -I xapMM: -I / CreationDate -I / BaseFont -I / ID --binary --text
Проблема все ще полягає в тому, що вона не завжди фіксує зміни у створених назвах шрифтів.