Можна використовувати бібліотеку pdf2image.
Ви можете встановити його, просто використовуючи,
pip install pdf2image
Після встановлення ви можете використовувати наступний код для отримання зображень.
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
Збереження сторінок у форматі jpeg
for page in pages:
page.save('out.jpg', 'JPEG')
Редагувати: Github repo pdf2image також згадує про те, що воно використовує pdftoppm
та що вимагає інших установок:
pdftoppm - це програмне забезпечення, яке робить справжню магію. Він поширюється як частина більшого пакета, який називається poppler . Користувачам Windows доведеться встановити poppler для Windows . Користувачам Mac доведеться встановити poppler для Mac . Користувачам Linux буде попередньо встановлено pdftoppm з дистрибутивом (протестовано на Ubuntu та Archlinux), якщо це не так, запустіть sudo apt install poppler-utils
.
Ви можете встановити останню версію під Windows за допомогою anaconda, виконавши:
conda install -c conda-forge poppler
Примітка: Версії Windows до 0.67 доступні за адресою http://blog.alivate.com.au/poppler-windows/, але зверніть увагу, що 0.68 вийшов у серпні 2018 року, тому ви не будете отримувати найновіші функції та виправлення помилок.