У своєму маловідомому романі, PDF Karenina , Лев Толстой писав:
Оптимально закодовані файли PDF однакові; кожен суб-оптимально закодований PDF-файл суб-оптимально закодований по-своєму.
Кому важко відповісти, чому ваші PDF-файли збільшуються після зміни попереднього перегляду. PDF-файл складається з безлічі різних типів даних: зображення, потоки вмісту, шрифти, накладні документи, кольорові простори, розширені графічні стану та перехресна таблиця. Так само, як одне речення може бути стислим, а інше багатослівним, але обидва є дійсними англійською мовою і говорять одне і те ж, так і один PDF-файл може мати більш багатослівний спосіб подання того ж вмісту, що і більш стислий PDF-файл. Ми повинні переглянути ваші точні файли PDF. Цілком ймовірно, що вони були створені за допомогою різноманітних програм, деякі з них, а з іншого боку.
Також важливо, яку версію Mac OS X та Preview ви використовуєте, оскільки це визначає програмне забезпечення, яке записує новий файл PDF, коли ви робите Save As in Preview.
Я можу, однак, сказати вам, що збільшується в деяких моїх PDF-файлах. Ця історія стосується мого комп'ютера, на базі Mac OS X 10.5.8 та Apple Preview 4.2 (469.5).
Один файл,, Giulio.pdf
являє собою 22-сторінковий документ із текстом у вигляді тексту, а не відсканованих зображень. Це 461 092 байт. Я відкрив його в Preview, зробив файл ... Save As ... і зберег під новим ім'ям файлу. Новий файл на 724,421 байт, або на 57% більший.
Я відкривав кожен файл за допомогою Adobe Acrobat Professional, версія 8.3.1 для Mac OS. Я зробив Advanced ... PDF Optimizer ... Аудит Space Usage ... . Невелике діалогове вікно дало підсумок, скільки байтів було обумовлено кожною категорією використання, плюс відсоток від загального розміру файлу для категорії.
Оригінальний Giulio.pdf
є 390,754 байти (84,75%), присвячені потокам вмісту, і нульові байти, присвячені зображенням. Він у форматі PDF 1.4. Файл, збережений за допомогою попереднього перегляду, має 675,846 байт (93,29%), присвячений потокам вмісту, також нульовим байтом зображень і знаходиться у форматі PDF 1.3. Попередній перегляд збільшив потоки вмісту на 285 092 байти, і це становить 73% різниці розмірів файлів між ними.
Мені було цікаво, чи формат файлу PDF 1.3 за своєю суттю менш ефективний для зберігання такого типу файлів. Я відкрив оригінал Giulio.pdf
в Adobe Acrobat Professional 8, і зробив Advanced ... PDF Optimizer ... Зробіть сумісний з: Acrobat 3.0 і пізніших версій і натиснув OK. Я зберег отриманий файл під новим іменем. Отриманий файл знаходиться у форматі PDF 1.3 і був 452 356 байт або менше, ніж оригінал. Його потоки вмісту - 375,171 байт (82,94%), аналогічна частка, але менша, ніж потоки вмісту вихідного файлу.
Таким чином, здається, ми можемо зробити висновок, що програма «Попередній перегляд» на Mac OS X 10.5.8 не настільки ефективна, як деякі інші творці PDF для створення стислих потоків вмісту у файлах PDF, і різниці достатньо, щоб враховувати три чверті різниці розмірів у PDF-файлі без зображень.
Я зробив подібний експеримент на form k.pdf
, 1-сторінковий документ, відсканований з паперу. Оригінальний файл - 303 730 байт, з яких 298,197 байт (98,18%) - зображення. Копія цього файлу, створеного за допомогою попереднього перегляду за допомогою Save As ..., становить 300 601 байт або на 1% менше. Ця різниця у розмірі файлу більше, ніж припадає на меншу категорію байтів "накладні витрати документа" у файлі, створеному за допомогою попереднього перегляду.
Таким чином, здається, ми також можемо зробити висновок, що попередній перегляд не завжди призводить до збільшення розміру файлу PDF. Це залежить від характеру оригінального PDF-файлу та того, наскільки лаконічно було почати.