Створіть PDF з HTML книги


16

Є деякі сайти, які пропонують книги як HTML-сторінки (наприклад, юридичні матеріали).

Що я можу використовувати для створення книги PDF з цих сторінок на основі вже існуючої структури?

У Windows є Adobe Professional (комерційне програмне забезпечення). Я здогадуюсь, що в Linux є щось безкоштовне? Для мене було б добре рішення, що стосується сценаріїв.

Відповіді:


9

Калібр - це досить потужний інструмент для перетворення речей у електронні книги у різних форматах. Доступний у програмному центрі поблизу вас!

Не обманюйте його менш ніж прекрасний інтерфейс, він може зробити багато.


1
caliber також поставляється з інструментом командного рядка, перетворення електронних книг. Так що з цим ви могли б зробити, for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; doneі це перетворило б усі HTML-файли в папці в PDF.
frabjous

1
Це хороший інструмент, я також користувач калібру, я думаю, що останній помітив поліпшення інтерфейсу користувача.
Сабакон

4

Найпростіший спосіб? Файл> Друк із браузера. Виберіть Друк у файл як принтер, і він запитає, де ви хочете. Обов’язково позначте PDF. Натисніть "Друк", і вона буде фактично збережена на вашому диску, а не надрукована.


Спасибі. Хоча файлів дуже багато. Цей маневр практично неможливий.
Лучан Сасу

4

Htmldoc може бути корисним, дивіться це тут; http://www.htmldoc.org/ доступний у програмному центрі, на жаль версія 1.8 має проблему з кодованими файлами, кодованими унікодом, але в багатьох випадках вона все ще може бути рятівником, проблема виправлена ​​у версії 1.9.

Я зазвичай використовую тут чудове розширення записок; http://amb.vis.ne.jp/mozilla/scrapbook/ для Firefox для зйомки веб-сторінок, використовуйте інструменти редагування в записках, щоб виправити їх, якщо це потрібно, а потім скористайтеся htmldoc для перетворення всіх сторінок у PDF.



3

Я рекомендую використовувати OpenOffice / LibreOffice для створення PDF-файлу. У якості тесту я завантажив мануал Wget (все на одній сторінці), а потім відкрив сторінку HTML в OponOffice і натиснув кнопку "Експортувати безпосередньо в PDF". Він створив PDF з індексом із змісту.

Раніше я вважав, що це найпростіший спосіб перетворення HTML-сторінок у PDF. Це також дозволяє внести зміни без особливих зусиль.

Скріншоти:

  • Посібник Wget, експортований у PDF, за допомогою Open Office Посібник Wget, експортований у PDF, за допомогою Open Office

  • Експортуйте безпосередньо в опцію PDF у Open Office Експортуйте безпосередньо в опцію PDF у Open Office


будь-які ідеї, якщо книга не на одній сторінці, а розбита на кілька глав / розділів?
Ciprian Tomoiagă

2

Я фактично проголосував за рішення калібру. Але ось ще можна спробувати. Встановити AbiWord . Він може робити перетворення між будь-якими відомими форматами з командного рядка. Щоб перетворити всі .html файли в папці в .pdf, ви можете:

for file in *.html ; do abiword --to=pdf "$file" ; done

Для типографії вищого рівня (але, мабуть, більш складної) іншим варіантом буде PrinceXML .


2

Залежно від html-документа, який слід надрукувати, ви можете отримати найкращі результати, використовуючи pandoc . Це один з найбільш універсальних перетворювачів HTML в LaTeX. Отриманий файл .tex можна легко перетворити в PDF , використовуючи xelatexабо pdflatex. Доступно багато варіантів, якщо ви бажаєте заглибитись у синтаксис та пакети LaTeX. Це може не спрацювати, якщо вбудовані зображення та стильні HTML-стилі мають бути збережені.


1

У google-chrome ви можете створити файл PDF для цілого сайту, використовуючи розширення. Я особисто використовую розширення Web2PDF Converter, що робить PDF лише одним кліком.

Ось скріншот цього плагіна, наданий веб-магазином розширень google.

введіть тут опис зображення

Крім того, ви можете побачити PDF, створений мною за допомогою цього інструменту, завантаживши наступний (клацніть правою кнопкою миші , збережіть ціль як): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (деякі браузери, такі як google- хром може дозволити вам бачити це в Інтернеті).

А якщо ви бажаєте редагувати PDF-файли, створені розширенням, щоб видалити цифровий підпис, розміщений розширенням у нижній частині кожної сторінки, або видалити що-небудь інше, погляньте на це: Видалити текстову інформацію з PDF?

Удачі!

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.