Як видалити водяний знак із файлу PDF?


41

Я думав, що це буде просте завдання, але вийшло іншим шляхом.

Водяний знак - це те саме (перекриваюче, але прозоре) зображення на кожній сторінці. Я створив PDF-файл сам (тому тут ніяких турбот щодо авторських прав) за допомогою PDFCreator 0.9.8.

Я вже спробував Adobe Acrobat Pro свого друга, але це не вийшло. Він намагається видалити його, але не може. Я намагався видалити заголовок / колонтитул тощо, але водяний знак просто не зникне.

Як я можу видалити водяний знак?


2
PDF - це вихідний формат, як електронна друкована сторінка. Це не призначене для редагування, і в більшості випадків ви не зможете робити те, що просите, не експортуючи сторінки до зображень і фотошопуючи водяні знаки.
mk12

Рекомендації щодо покупок поза темою для всіх веб-сайтів з обміну стеками. Щоб запобігти закриттю цього питання, я б рекомендував змінити його на питання як, а не на яке
канадський Лука ВІДНОВЛЕННЯ MONICA

3
Здається, ви просто використовуєте PDFCreator 0.9.8 і встановите параметр, щоб водяний знак НЕ додався на кожну сторінку. Я припускаю, що це питання тому, що у вас немає початкового джерела.
Рамхаунд

Відповіді:


73

Для водних знаків на основі зображень існує кілька інструментів, які обіцяють їх автоматичне видалення. Наприклад:

Все це можна спробувати, але потрібно ліцензія, щоб фактично отримати бажаний результат.

Однак водяний знак цього конкретного PDF-файлу (який ОП надіслав мені електронною поштою) - це не одне зображення, яке повторюється на всіх сторінках. Як виявляється, PDFCreator жорстко закодував його (майже піксель за пікселем) у кожну з них. Це робить водяний знак набагато складнішим для видалення (і призводить до отримання досить роздутого PDF-файлу).

Оскільки водяний знак насправді складається з безлічі крихітних зображень, ви можете видалити їх за допомогою редактора PDF (наприклад, Foxit Advanced PDF Editor ), просто вибравши їх і натиснувши Delete. На жаль, вам доведеться повторювати це на кожній сторінці.

Менш трудомістким рішенням буде програмне видалення водяного знака. Нам потрібно:

Кроки

  1. Завантажте Pdftk і витягніть pdftk.exe та libiconv2.dll до % windir% \ System32 , каталог на шляху або будь-яке інше місце на ваш вибір.

  2. Завантажте та встановіть Notepad ++.

  3. PDF-потоки зазвичай стискаються за допомогою алгоритму DEFLATE . Це економить місце, але робить джерело PDF нерозбірливим.

    Команда

    pdftk original.pdf output uncompressed.pdf uncompress
    

    розтискає всі потоки, тому їх можна змінити текстовим редактором.

  4. Відкрийте нестиснений.pdf за допомогою Notepad ++, щоб виявити структуру водяного знака.

    У цьому конкретному випадку кожна сторінка починається з блоку

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    і майже 4000 блоків, як цей. Цей конкретний блок встановлює лише один ( /W 1 /H 1) пікселів водяного знака.

    Прокручування вниз до зміни шаблону виявляє, що потік водного знака становить 95906 байт (рахуючи нові рядки). Той самий потік повторюється на кожній сторінці PDF-файлу.

  5. Натисніть Ctrl+ Hі встановіть наступне:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    Регулярний вираз q 9 0 0 9 2997 4118\.67 cm.{95881}відповідає першому рядку вищезазначеного блоку ( q 9 0 0 9 2997 4118.67 cm) і всі наступні 95,881 символу, тобто потік водяного знака.

    Клацання Замінити все видаляє його з усіх сторінок PDF-файлу.

  6. Водяний знак тепер видалено, але у файлі PDF є помилки (довжина потоків неправильна) і він не стискається.

    Команда

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    піклується про обох.

  7. нетиснений.pdf більше не потрібен. Ви можете її видалити.

Результат - той самий PDF без водяного знака (і приблизно в половину розміру).


4
Ще одна хитрість, яку я вважав корисною: мені було важко розібрати блок, що відповідає водяному знаку в моєму PDF. Тож я зробив лише вилучення однієї сторінки з PDF, в ідеалі сторінки, де є лише водяний знак і не багато іншого. Тільки з цієї однієї сторінки було б легше розібрати блок, який відповідає водяному знаку. Потім поверніться і зробіть це для оригінального PDF.
Кенні LJ

1
Ого, це перше місце в Інтернеті, я знайшов хороший спосіб управління цим. Будь-які місця, які ви рекомендуєте прочитати у форматі контейнера?
КонстантинК

2
@hobs IIRC, я прочитав частини офіційного посилання на PDF, щоб написати цю відповідь.
Денніс

1
Дякую @Dennis, я вже дав тобі відгук, але це, здається, найкраще канонічне джерело. Мені вдалося виконати те, що мені потрібно було зробити лише деяким пошуком / заміною та кількома додатковими спробами стиснення та помилками. ВЕЛИЧЕЗНА ДОПОМОГА!
КонстантинК

7
Замість цього pdftkви також можете використовувати qpdf для розпакування та стискання файлів PDF. Команди: qpdf --stream-data=uncompress original.pdf uncompressed.pdfіqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
Девід Шулер

6

Це здається, що водяний знак насправді є частиною зображень у форматі .PDF, а не окремим зображенням, що відображається над ним тим, що ви використовуєте для відображення .PDF. Можливо, ви не зможете видалити водяний знак, не витягуючи зображення з .PDF, запускаючи їх через редактор зображень та реконструюючи .PDF вручну.


4

Для текстових водяних знаків редагування версії PostScript може бути набагато простішим: Після

$ pdftops document.pdf

редагуйте document.ps, а потім конвертуйте назад у PDF через

$ ps2pdf document.ps


В Linux, будьте обачні pdftopsта pdf2psрізні. Використовуйте першу команду, а не другу.
Camille Goudeseune

1
Якщо ви знаєте, що таке текст водяних знаків, ось однокласиця. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune

1

Артефакти штампу полягають у тому, що ви можете видалити його в Adobe Acrobat Pro, однак він відновлюється при русі миші, оскільки об’єкт потоку зберігає його стійким.

Якщо ви спробуєте відредагувати джерело pdf - що складно, є ймовірність, що файл буде пошкоджений.

Якщо штамп - це потік, ми можемо перервати його, відключивши комп'ютер від мережі, що я і зробив.

Потім за допомогою Adobe Acrobat Pro я вибрав одне зі своїх приміток, клацнув правою кнопкою миші, щоб отримати спливаюче вікно, і вибрав «Показати список коментарів».

Виберіть зі списку підступний водяний знак / штамп, клацніть правою кнопкою миші, щоб отримати спливаюче вікно та виберіть "Видалити". Робіть це на кожній сторінці, де відбувається афіксація.

Збережіть файл під іншим іменем. Моя програма вийшла з ладу, але не перед збереженням файлу!

Відкрийте новий & значно менший файл; зауважте, що всі водяні знаки / марки є гонзо.

У моєму випадку розмір файлу мого 3-сторінкового документа зменшився від 300 кб до вражаючих 60 кб. Всі оригінальні дані та примітки залишилися недоторканими - водяні знаки.

~ Добре полювання: o)


1

перетворити документ у .rtf-файл за допомогою zamzar. Водяний знак автоматично зникає після перетворення. Зверніть увагу: - Він прекрасно працює, якщо документ містить текстовий матеріал. Це завжди допомагало ... (користувач Mac)


Це не працює для PDF, який я спробував.
Kenny LJ

1

Знайшли інший спосіб зробити це:

  1. Використовуйте інструмент pdf2htmlEX (або будь-який інший PDF у HTML конвертер) для перетворення PDF у HTML-файл.
  2. Відредагуйте HTML за допомогою текстового редактора та видаліть водяний знак. Збережи це.
  3. Роздрукуйте в HTML до нового документа PDF
  4. Прибуток

Дякую. Ви впевнені, що не змогли таким чином видалити водяний знак за допомогою Adobe Acrobat? (Це може бути і більш дешевим рішенням.)
Apache

Я вважаю, що вам потрібен якийсь пароль для того, щоб видалити водяний знак в Adobe Reader, отже, я використовував цей метод.
Домінік Антал

0

Це доповнення до відповіді @Dennis від 18:06 30 липня 2012 року. Він, безумовно, стосується більш важкої справи.

У найпростішому випадку, коли водяний знак - це, наприклад, простий текст без тексту

Смедлі для комісара

нестиснені водяні знаки PDF можуть бути визначені так:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

де 75.96горизонтальне зміщення та 625вертикальне зміщення для цього конкретного екземпляра водного знака. (Так, можуть бути видно як дійсні числа, так і цілі числа.)

Повторне позначення, як описано нижче, буде працювати для всіх таких водяних знаків, ігноруючи будь-які варіації їх розміщення:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Майте на увазі, що різноманітні модифікатори PDF-операторів можуть грати з водяними знаками, які мають більш складне форматування. Така фантазія може перетворити те, що читач очікує (сподівається?) На суміжний, легко шуканий рядок, у безладний алфавітний суп. Наприклад,

E 1 = mc² Smedley ™

Може бути продуктом цього:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . або набагато гірше, якщо ваш водяний знак покращений кольором!

Зауваживши все це, я також зазначу, що PDFtk має версію GUI, яка призначена для обробки водяних знаків, враховуючи плату за ліцензію в розмірі 4 доларів. Зовсім не дорого!

З іншого боку, я вважаю, що його веб-сайт в даний час рекламує повну підтримку O / S через Windows 8і OS X 10.8 Mountain Lion. Цього урожаю понад 4 роки тому. Чи може PDFtk застаріти? Я не підозрюю, але не знаю.


Дякую за рекомендацію PDFtk, виглядає акуратно, але так "трохи пахне". Безкоштовна версія - 2.02. У Вікіпедії сказано, що вона була випущена 3 роки тому: en.wikipedia.org/wiki/PDFtk
Apache

1
@Shiki - насправді я провів серйозні дослідження форматів PDF, але списав детальну оцінку прогресу PDF за останні 10 років. Ось підсумок: " Недолік трирічного випуску PDFtk у світлі розробки специфікацій PDF". Незважаючи на те, що з, скажімо, 2005 року, було декілька оновлень, _ ви будете добре з _PDFtk_ по всій ймовірності. Я кажу про це, перевіривши деякі загальнодоступні сучасні джерела документів PDF. Усі документи, які я перевірив, були створені для стандартів PDF до 2010 року (ще раніше, насправді.) Якщо у вас виникли сумніви, перевірте кілька десятків байт відповідного файлу PDF.
Der Schley

0

Ось безкоштовні та платні способи зробити це, я пропоную вам скористатися Google Drive.

Google Drive має можливість відкривати файли та робити невеликі редагування. Крім того, його можна використовувати для видалення водяного знаку з PDF в Інтернеті.

  1. Відкрийте свій обліковий запис Google Диска, який в основному такий же, як і ваш Gmail.
  2. Клацніть «Створити»> «Завантажити файл», виберіть документ PDF та завантажте його.
  3. Після цього ви можете перевірити завантажений файл на Диску, а потім клацніть правою кнопкою миші, щоб відкрити його за допомогою "Документів Google".
  4. Після цього ваш водяний знак буде видалений автоматично. Щоб зберегти його, перейдіть до «Файл» та натисніть «Завантажити як», а потім виберіть «PDF документ».
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.