Перетворення веб-сторінок в один файл для книги


23

Я хочу завантажити HTML (наприклад: http://www.brpreiss.com/books/opus6/ ) і приєднати його до одного HTML чи іншого формату, який я можу використовувати в читальнику електронних книг. Сайти з безкоштовними книгами не мають стандартного підкачки, вони не є блогами чи форумами, тому не знаю, як зробити автоматичне сканування та злиття.

Відповіді:


13

Ви можете використовувати Calibre для перетворення електронних книг. Ви можете змусити його створити одну книгу з декількох HTML-файлів, посилаючись на них з одного HTML-файлу, який ви налаштуєте у вигляді подібного вмісту .


Я використовую Sigil для перетворення в EPUB, але не знав, що Cailbre може зробити одну книгу з купки пов'язаних htmls. Я спробую, дякую!
Хрвой Худо

1
Ви можете використовувати httrack.com для завантаження веб-сторінок, а потім скористатися Calibre, щоб конвертувати їх у формат ePub.
에이 바

3
У моєму процесі (за допомогою Chrome) - використовувати закладку Text Instapaper Text, щоб трохи очистити речі, потім клацніть правою кнопкою миші -> Зберегти як. потім скористайтеся функцією "Редагувати книгу", щоб прибрати будь-які додаткові безладні розмітки, які потрапляють.
El Yobo

6

Як я це робив, це був Калібр.

Це стало занадто сильним болем, хоча я створив розширення для Chrome, щоб полегшити його.

Це називається EpubPress ( http://epub.press ).

Це дозволяє створити електронну книгу на вкладках Chrome.

Сподіваюся, що це допомагає!


3
Веб-сайт у вашому посиланні говорить про те, що упаковка відбувається на сторонній сервер, конфіденційність НЕ гарантується цим методом.
Бургі

Чи є у вас пропозиції щодо змін, які б змусили вас почувати себе більш захищеними? Я зробив усе можливе, щоб вимагати лише мінімальної інформації для створення книги, але я відкритий для подальшого відгуку. Якщо ви подивитеся на будь-яку порівнянну послугу, ви побачите, що будь-який вміст, який ви хочете зберегти, надсилається на сервер. Різниця полягає в тому, що для цих служб також потрібен обліковий запис і весь вміст, пов'язаний з вашим іменем. Вони також не надають вихідний код для своїх веб-сайтів, щоб ви могли бачити, що вони збирають. Розширення є відкритим кодом, і я радий відповісти на будь-які запитання щодо цього коду.
HaroldT

Який чудовий інструмент! Дуже дякую, що надали громаді безкоштовно!
фондж

5

Pandoc може взяти посилання на сторінку (або html-файл) і перетворити її в pdf / epub ...

Я не впевнений, чи повзав би. Якщо цього не відбувається, ви можете пересканувати сторінки спочатку за допомогою wget або чогось іншого (або просто зібрати посилання) і надати його pandoc.


Згідно з довідковою сторінкою, це буде: "Замість файлу може бути заданий абсолютний URI. У цьому випадку pandoc вибере вміст за допомогою HTTP"
jopasserat


1

HTTrack - це хороший варіант - він створить електронну книгу з веб-сайту: її можна завантажити тут: https://www.httrack.com/ HTTrack "дозволяє завантажувати всесвітній веб-сайт з Інтернету на локальний каталог, будуючи рекурсивно всі каталоги, отримуючи HTML, зображення та інші файли з сервера на комп'ютер. HTTrack організовує відносну структуру посилання оригінального сайту. "

Потім ви можете перетворити HTML в EPUB, AZW3 або PDF за допомогою програми Caliber або будь-якого іншого програмного забезпечення для перетворення HTML у epub.

Другий варіант конвертації безпосередньо в EPUB - це EpubPress: він має розширення, що дозволяють використовувати Firefox (лише v44.0 +) або Chrome. Для використання цього програмного забезпечення потрібно відкрити вікно браузера. Кожна вкладка по суті є "главою" у вашій книзі. Впорядкуйте вкладки у потрібному порядку появи, після чого активуйте epubpress - він завантажить та упорядкує вкладки у порядку їх появи, у форматі .epub. Сподіваюся, це допомагає!

* Однак зауважте, що EpubPress завантажує окремі веб-сторінки, а не "веб-сайт", як це робить HTTrack. Щоб завантажити веб-сайт за допомогою EpubPress, потрібно відкрити кожне посилання на веб-сайті як окрему вкладку, а потім скористатися Epubpress для збору цих посилань у формат .epub.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.