Створіть один PDF-файл із HTML-сторінок веб-сайтів


0

Ось проблема: Є веб-сайт, який мені часто потрібен для довідок, і я хотів би офлайн-версію, яка також працює на мобільних пристроях.

Я можу зробити офлайн-копію версії HTML за допомогою wget, це не проблема.

Що мені дуже хотілося б - це спосіб перетворити всі HTML-сторінки в один PDF-файл із внутрішніми посиланнями, які все ще працюють. Отже, посилання, яке б посилалося на іншу URL-адресу у веб-версії, повинно тоді посилатися на відповідну сторінку в PDF.

В ідеалі також повинен бути спосіб генерувати вміст, який слід розмістити в PDF.

Як я можу цього досягти?

Баш / Python / ruby ​​/ будь-які сценарії та інші елементи командного рядка також вітаються.

(До речі, я на OSX 10.9.)


PDF на мобільних пристроях, на мою думку, досить жахливий. Можливо, вам буде набагато краще зберігати його у форматі HTML, який ви отримуєте від wget, оскільки належним чином створений HTML автоматично витончено змінить розмір екрана. Якщо він все ще зберігає повнорозмірний розмір, він буде таким же, як і у форматі PDF, ви залишилися б на цьому розмірі екрана, працюючи на крихітному екрані.
Дарій

У цьому випадку PDF-файл буде чудовим, оскільки його читатимуть здебільшого на iPad. Хоча ePub теж буде добре. Все, що можна завантажити у додаток iBooks.
самообслуговування

У мене ще є проблеми з PDF в iBook, але я думаю, це особиста думка. Не впевнений, як перенести HTML у формат для читання iPad, але найближче зачитування офлайн-сторінок - це використання додатка під назвою "Pocket" (було прочитано його пізніше), але я не впевнений, чи є вони на всьому веб-сайті, але вони роблять сторінки.
Дарій

Ні, Pocket або Instapaper призначені лише для окремих сторінок. Мені потрібен цілий сайт з великою кількістю сторінок.
самообслуговування

2
Ви дивилися на Калібра чи Сигіла. Дивіться тут . Я не намагався, але Caliber повинен мати можливість зробити електронну книгу з декількох Htmls, якщо вони пов'язані.
Рік

Відповіді:


1

Слід поглянути на wkhtmltopdf , безкоштовний інструмент, який, судячи зі списку розширених функцій, розміщених на його сторінці керівництва , повинен хоча б приблизно задовольнити вас:

Друк більше одного документа HTML у PDF-файл.

Запуск без сервера X11.

Додавання контуру документа до файлу PDF.

Додавання колонтитулів до PDF-файлу.

Формування змісту.

Додавання посилань у створений файл PDF.

Друк за допомогою екранного носія.

Вимкнення функції інтелектуального зменшення веб-сайту.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.