Як зберегти PDF-файл зображення у вигляді зображення?


33

У мене є PDF, який містить скануюче зображення документа. Я хочу зберегти вміст цього PDF у вигляді зображення, щоб потім запустити його через програму OCR, яка приймає лише файли типу .jpg, .png та .gif.

Як зберегти / перетворити цей PDF в один із цих форматів зображень?

EDIT: Один із способів, який я знайшов для цього, - це натискати на кожну сторінку. Копіювати в буфер обміну. Вставте на Paint.net, а потім збережіть. Однак це громіздко, оскільки, здається, ви можете одночасно вибрати лише одну сторінку в програмі Acrobat Reader.

Відповіді:


20

Будь ласка, зверніть пильну увагу на відповідь Poororick , в якій він вказує, як відповідь Слеске насправді набагато краща відповідь на цю конкретну проблему.


Використовуйте GhostScript . Ця команда працює для мене:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Існує кілька псевдоприладів png, що розрізняються за глибиною кольору: pngmono, pnggray, png16, png256, png16m та pngalpha. Вибирайте те, що підходить вам найкраще.

Ви також можете використовувати jpeg, але, якщо у вас немає проблеми з дисковим простором, ви хочете настільки ж високої якості, як ви можете керувати своїм OCR, і це не jpeg.

GhostScript більше не підтримує gif, але я не можу уявити, для чого вам це потрібно, що з підтримкою png256.


Я люблю GhostScript, і якщо ви хочете , зручність графічного інтерфейсу для налаштування параметрів, перегляду і т.д. спробувати GSview pages.cs.wisc.edu/~ghost/gsview
Dennis

Чи буде вихід одним величезним зображенням?
Xonatron

1
@Xonatron: Ні. Одне зображення на сторінку. Ім'я %dу вихідному файлі - це змінна, яка замінюється номером сторінки. (Майже напевно необроблені цифри, а не кількість всередині PDF.)
wfaulk

20

Встановіть Imagemagick . Відкрийте вікно або термінал cmd:

convert myfile.pdf myfile.jpg

Вихід буде 1 jpg-файл для кожної сторінки у вашому pdf, test-0.jpg, test-1.jpg тощо.


+1 для ImageMagick, але -2 за те, що він запропонував неправильну роботу. JPEG хороший для фотографій, але це найгірший формат, який можна використовувати, коли у вас різкі поштовхи та високі контрасти (як зазвичай у вас чорний текст / символи на білому тлі). Крім того, ImageMagick не виконує перетворення самостійно, він використовує Ghostscript у фоновому режимі як його "делегований" підлеглий. Таким чином, це робити безпосередньо з Ghostscript дає вам більше контролю над використовуваними параметрами. А потім виберіть TIFF (не JPEG) як вихідний формат, заради кризи!
Курт Пфайфл

1
Зверніть увагу на Windows, переконайтеся, що спочатку встановите 32-розрядний Ghostscript.
Користувач

2
Будьте в курсі density, depthі qualityпрапори , які можуть допомогти вам оптимізувати продуктивність. Наприклад: convert -density 300 -depth 8 -quality 85 a.pdf a.png Більше інформації
Нік

13

Там також pdfimagesвід Xpdf інструментів (доступно з сайту XpdfReader ). Він не перетворить всю сторінку PDF в зображення, скоріше витягне вбудовані зображення з PDF.

Це корисно, якщо PDF містить текст та зображення, а ви хочете лише зображення. Крім того, він буде витягувати зображення в оригінальному форматі, тому втрата якості не задіяна (на відміну від програм, які рендерують всю сторінку і потім конвертують її в наприклад JPEG). Залежно від ваших потреб це може бути корисним.


Просте використання:

pdfimages -j -list mydocument.pdf mydocument-images

Це буде читати вхідний файл mydocument.pdf, витягти всі зображення і записувати їх в окремі файли з ім'ям mydocument-images-0000.jpg, і mydocument-images-0001.jpgт.д.

Опція -jзмушує записувати вбудовані зображення, стиснуті у форматі JPEG, у форматі JPEG, а не як файли PBM / PGM / PPM (які не стиснуті та величезні). Зверніть увагу, що зображення все ще можуть записуватися у вигляді файлів PBM / PGM / PPM, якщо вони так зберігалися у вхідному файлі PDF.


Для довідки, просте використання є pdfimages -j "yourinputfile.pdf" "outputimages"що зробить «outputimages-0000.ppm» (або «outputimages-0000.jpg» , якщо вони право формату). Приклади .NET можна
нанести

Застереження полягає в тому, що він, можливо, не зможе зберегти файл як JPG, а скоріше як PPM
drzaus

11

Ви можете зробити це за допомогою Adobe Reader:

  1. Клацніть на зображенні. Це буде виділено.
  2. Скопіюйте (Ctrl-C) і вставте його в Paint.
  3. Збережіть будь-який тип файлу, який вам подобається.

2
що цікаво знати, Adobe Reader має налаштування, щоб змінити dpi зображень, зроблених інструментом "знімок", якщо встановлено 300dpi, ви отримаєте готові до друку знімки (за замовчуванням прийнята роздільна здатність екрана, яка, як правило, занадто низька повторне використання в іншій роботі)
Стийн Сандерс

3
+1 для простоти. Більшість читачів PDF дозволяє вам це зробити.
Decio Lira

4
Що робити, якщо у вашому PDF є 10000 сторінок зображень? Чи потрібно це робити 10000 разів?
Хлопець

9

За винятком відповіді, в якій згадуються pdfimages, всі інші відповіді не згадують, що їхні рішення насправді перекодують вбудовані зображення. Тобто ці рішення не просто витягують оригінальне зображення, а змінюють його, можливо, на шкоду зображенню, під час процесу. Лише pdfimages витягує оригінальне зображення. Це стосується Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview та більшості інших програмних засобів PDF.


З огляду на контекст питання, це насправді дуже хороший момент.
wfaulk

FWIW, "Інструменти PDFill PDF" дозволяє вам встановити DPI для збереження як зображення, дуже зручно. Таким чином, кожна сторінка (починаючи з тексту, зображень, будь-яких об'єктів) зберігається, наприклад, до PNG з високою роздільною здатністю на 4961x6520.
Кріс О

4

PDFill PDF Tools - це, мабуть, найлегший спосіб перетворення PDF-файлів у зображення у Windows. Це дозволить вам експортувати всі сторінки в PDF, щоб розділити зображення в один кадр. Він також має безліч інших функцій, доступних безкоштовно, які доступні лише в інших переглядачів PDF, якщо ви купуєте комерційну або "Pro" версію.

Використовуйте кнопку "Перетворити PDF у зображення" (кнопка №10) на скріншоті нижче.

Скріншот PDFill PDF Tools

Якщо вам потрібно об'єднати зображення в одне дуже високе зображення, щоб вам довелося подати лише один файл у вашу програму OCR, ви можете використовувати IrfanView


зауважте, що це встановить два різних інструменти у вашій системі. Основним з них є редактор PDFill, який вам не потрібен. Перейдіть у меню "Пуск", щоб відкрити це. Мене врятував знімок екрана, зрозумівши, що щось не було як перед тим, як видалити його.
ufotds

Так, я думаю, я не зазначив, що він також встановлює умовно-безкоштовну версію редактора PDFill, а також PDF-принтер. Будь-які файли, створені за допомогою редактора PDFill, матимуть водяний знак, якщо ви не купите редактор за $ 19,99, але утиліта PDFill PDF Tools Безкоштовна утиліта не потребує покупки. У наявній версії ви не можете видалити PDFill Editor, не видаливши PDFill PDF Tools безкоштовно, але встановлення PDFill Editor нічого не шкодить.
пограбувати

2

Оскільки ви не включили тег ОС, я включу відповідь OSX:

PDF-файли за замовчуванням відкриваються у Preview.app, що дозволяє використовувати File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF

1

Також PDF Xchange Viewer (безкоштовно) здійснюватиме експорт у файл. Файл → Експорт → Експорт у зображення.

Мало того, але я думаю, що це найкращий переглядач PDF у Windows, і він має деякі приємні можливості розмітки. У мене є ліцензія на Adobe Acrobat, і я все ще віддаю перевагу цьому, якщо я не займаюся широким редагуванням, що рідко.


Це виглядало багатообіцяючим, поки я не виявив, що можливість експорту в зображення відключена з PDF-файлів, захищених паролем.
Мітч

1

(Безкоштовно) Acrobat professional робить це:

Додатково-> Обробка документів-> Експорт усіх зображень ...


0

Якщо файл менше 5 МБ і ви не турбуєтесь про конфіденційність / конфіденційність, то це зручний сервіс в Інтернеті за адресою http://www.go2convert.com/, який може зробити багато графічних перетворень (включаючи pdf в jpeg)


Щойно спробував, і він дав це повідомлення про помилку "Вибачте! Це зображення не вдалося перетворити правильно".
Хлопець

-1

Якщо зображення перевищує розмір екрана, ви можете скористатися функцією FastStone Capture (функція "Вікно прокрутки захоплення") і зберегти зображення як JPEG.

alt текст


Це дуже крутий спосіб захоплення зображення. ОП вже має краще рішення (маркована сторінка в Acrobat).
sleske

-1

Ви можете переглянути цю статтю .

У ньому перераховано 6 різних способів перетворення PDF у зображення.

Перетворення PDF в JPG (веб-шлях)

PDF в JPG конвертери для робочого столу


гм .. Чому зволікають?
noob
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.