Зараз я використовую PDF-зчитувач Foxit, і нещодавно я завантажив зображення з Інтернету, але воно знаходиться всередині PDF-файлу. Як витягти це зображення?
Операційною системою є Windows 7.
Зараз я використовую PDF-зчитувач Foxit, і нещодавно я завантажив зображення з Інтернету, але воно знаходиться всередині PDF-файлу. Як витягти це зображення?
Операційною системою є Windows 7.
Відповіді:
Швидкий спосіб, якщо вам не потрібна оригінальна роздільна здатність пікселя зображення, - це просто натиснути кнопки ALT та Print Screen. Тоді вибирайте вставити куди завгодно зображення.
Інший спосіб зберегти роздільну здатність - відкрити PDF у програмі для редагування зображень, такої як Adobe Photoshop, та працювати з ним.
pdfimages.exe
стане в нагоді.
Якщо ви завантажите XPDF для Windows ( тут ), ви знайдете все .exe-файли всередині. Ви можете запустити їх без "встановлення". Використовуйте pdfimages.exe
так:
pdfimages.exe -help
Це відобразить екран довідки.
pdfimages.exe ^
-j ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
Це витягує всі JPEG як префікс-00N.jpg, а всі інші зображення як префікс-00N.ppm (Portable PixMap).
[ Редагувати ComFreek: Будь ласка, зверніть увагу на прорізну косу рису в шляху призначення, що важливо, якщо ви не хочете витягувати всі зображення в його батьківський каталог.] -
{ Редагувати KurtPfeifle: Я не згоден з коментарем ComFreek, але залиште читачам слід перевірити та з’ясувати самі відмінності в результатах. Мій оригінальний параметр, який не використовує косу рису, як ..\prefix
буде префіксувати назви зображень, які використовуються для вилучених файлів.}
pdfimages.exe ^
-j ^
-f 11 ^
-l 13 ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
Те саме, що і раніше, але обмежує витяг зображення на сторінки 11 ('f' = перша) до 13 ('l' = остання).
Тим часом я віддаю перевагу версії Popplerpdfimages
- тим більше, що вона набула цієї нової функції: додайте -list
до командного рядка, щоб просто перелічити (не витягнути) зображення, що містяться в PDF, а також деякі їх властивості. Приклад:
pdfimages -list -f 7 -l 8 ct-magazin-14-2012.pdf число сторінки тип ширина висота колір comp bpc enc інтерфейс ідентифікатора об'єкта -------------------------------------------------- ------------------- 7 0 зображення 581 838 rgb 3 8 jpeg no 39 0 7 1 зображення 4 4 rgb 3 8 зображення № 40 0 7 2 зображення 314 332 rgb 3 8 jpx no 44 0 7 3 зображення 358 430 rgb 3 8 jpx no 45 0 7 4 зображення 4 4 rgb 3 8 зображення № 46 0 7 5 зображення 4 4 rgb 3 8 зображення № 47 0 7 6 зображення 4 6 rgb 3 8 зображення № 48 0 7 7 зображення 596 462 rgb 3 8 jpx no 49 0 7 8 зображення 4 6 rgb 3 8 зображення no 50 0 7 9 зображення 4 4 rgb 3 8 зображення № 51 0 7 10 зображення 8 10 rgb 3 8 зображення № 41 0 7 11 зображення 6 6 rgb 3 8 зображення № 42 0 7 12 зображення 113 27 rgb 3 8 jpx no 43 0 8 13 зображення 582 839 сірий 1 8 jpeg no 2080 0 8 14 зображення 344 364 сірий 1 8 jpx № 2079 0
Зверніть увагу ще раз: ця версія pdfimages
є однією з Poppler (один з Xpdf ніяк НЕ (поки) підтримують цю нову функцію?), А версія повинна бути v0.20.2 або вище.
convert
. Доступно для Linux, Windows, MacOS X та що у вас є. Найпростіший випадок використання для вас: convert some.ppm some.jpeg
.
pdfimages
, і деякі люди можуть скористатися цим.
Ви можете спробувати імпортувати PDF в Inkscape і працювати звідти. Inkscape відкриє лише одну сторінку одночасно, але надасть вам повний контроль над вмістом сторінки. Ви зможете досить легко витягувати та маніпулювати векторною графікою з PDF.
Однак якщо ви хочете витягти растрові зображення з PDF, я впевнений, що pdfimages
з XPDF це простіше (але ви все одно можете спробувати використовувати Inkscape, дізнавшись, як витягувати вбудовані зображення з SVG-файлів ).
Не встановлюючи жодного програмного забезпечення, ви можете перейти на PDF-XChange Viewer (виберіть портативну версію ), яка вже має вбудовану здатність
може зберегти кілька сторінок як багатосторінковий TIFF
Будь ласка, майте на увазі, поки цей метод перетворює цілі сторінки PDF у зображення, метод, пояснений від @Laurenz за допомогою Суматри PDF, є кращим, якщо ви бажаєте витягувати зображення зі сторінки PDF зі змішаним вмістом (зображення + текст), щоб отримати лише зображення.
Sumatra PDF - це швидкий і легкий зчитувач PDF з відкритим кодом, який може копіювати зображення безпосередньо у буфер обміну, без будь-якої повторної растерізації.
MuPDF - це нова (створена в 2006 році) мультиплатформна програма для перегляду PDF (настільних та мобільних пристроїв), випущена за ліцензією AGPL. Його підтримують ті самі люди Ghostscript .
Він містить інструмент командного рядка для отримання зображень із PDF:
mutool extract [options] file.pdf [object numbers]
Команда витягу може використовуватися для витягування зображень та файлів шрифтів з PDF. Якщо в командному рядку не вказані номери об'єктів, всі зображення та шрифти будуть вилучені.
-p password
Use the specified password if the file is encrypted.
-r Convert images to RGB when extracting them.
використання pdftocairo
від poppler toolkit
. Він може витягувати та конвертувати зображення PDF у будь-який бажаний формат. Він завжди генерує зображення і ніколи не генерує ppm чи якісь подібні коси. Наступна команда приховає сторінки PDF у jpg-образи з нього:
pdftocairo.exe -jpeg "my.pdf" "my"
Ви можете отримати його тут для вікон: http://blog.alivate.com.au/poppler-windows/
Він доступний і в Linux.
http://www.sumnotes.net/ - це онлайн-інструмент для вилучення приміток, яскравих зображень та зображень. Я широко використовував його в університеті для своєї дипломної роботи і був дуже задоволений.
як правило, я витягую вбудоване зображення з 'pdfimages' за рідною роздільною здатністю, а потім використовую перетворення ImageMagick у потрібний формат:
$ pdfimages -list fileName.pdf
$ pdfimages fileName.pdf fileName # save in .ppm format
$ convert fileName-000.ppm fileName-000.png
це генерує найкращий і найменший файл результатів.
Примітка. Для вбудованих зображень, вкладених у JPG, вам довелося використовувати -j:
$ pdfimages -j fileName.pdf fileName # save in .jpg format
На мало забезпеченій платформі Win вам довелося завантажити останній (0.37, 2015) двійковий файл "poppler-util" з: http://blog.alivate.com.au/poppler-windows/
ОНОВЛЕННЯ: В останній версії "poppler-util" 0,50+ (2016) у pdfunite є опція "-all", щоб витягти без стиснених растрових зображень без втрат, як.
$ pdfimages -all fileName.pdf fileName
витягуйте завжди найкращий якісний вміст з PDF