Завантажувач веб-сайтів (кеш-пам'ять?) Для перегляду сайтів в режимі офлайн


9

Чи є портативний спосіб завантаження або кешування всіх сторінок веб-сайту для перегляду в режимі офлайн? У мене завтрашній рейс, і я хотів би мати можливість кешувати декілька веб-сторінок (зокрема, сторінку doc python ( http://docs.python.org/ ) та посилання pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

В ідеалі я хотів би доповнити Firefox або щось подібне, але все буде добре, доки я можу запустити його на Linux.


Відповіді:


15

Я використовую HTTrack .

Це дозволяє завантажувати всесвітній веб-сайт з Інтернету в локальний каталог, створюючи рекурсивно всі каталоги, отримуючи HTML, зображення та інші файли з сервера на комп'ютер


Я використовував це в минулому, приємне безкоштовне рішення.
MaQleod

1
HTTrack найкращий і для Linux, і для Windows, і існує величезний список варіантів налаштування процесу завантаження .. Мені це подобається
eslambasha

Я також ним користувався; тепер вони також пропонують версію Android.
gparyani

-1 Він не створює "всіх каталогів", він не отримує всіх "зображень та інших файлів". Він отримує лише те, з чим пов'язано.
барлоп

6

Я використовую wget з цими параметрами для дзеркального відображення сайту для використання в режимі офлайн

wget -cmkE -np http://example.com/a/section/i/like

де

-m вмикає параметри дзеркального відображення для локального відображення сайту

-c продовжує попереднє завантаження у випадку, якщо я вже завантажив деякі сторінки

-k перетворює абсолютний href, щоб вказати на локальні для перегляду в режимі офлайн

-E забезпечує, що файли мають .html розширення після завантаження.

-np завантажує лише об'єкти під / a / section / i / і не кешує весь сайт.

Наприклад, я хотів завантажити документацію на південь, але не квитки на південь тощо.

wget -cmkE -np http://south.aeracode.org/docs/index.html

Я використовую Windows і запускаю wget на cygwin, але є також рідний порт wget wget .

Хоча, у вашому випадку, ви можете завантажити файли в режимі офлайн python із розділу Документи python


1

Спробуйте http://www.downthemall.net/ плагін Firefox. Я використовував його для завантаження 250 сторінок PDF-файлів у 20+ окремих файлах. Він надзвичайно потужний. У ньому є синтаксис підстановки / запиту, який дозволяє хірургічно отримувати лише ті файли, які ви хочете, і жоден із непотрібних, які ви не робите.


1

Деякі розширення Firefox, про які я знаю:

  • Записка

    допомагає зберігати веб-сторінки та легко керувати колекціями. Ключові особливості - це легкість, швидкість, точність та багатомовна підтримка. Основні особливості:

    • Зберегти веб-сторінку
    • Збережіть фрагмент веб-сторінки
    • Збережіть веб-сайт
    • Організуйте колекцію так само, як і Закладки
    • Повний текст та швидкий фільтруючий пошук колекції
    • Редагування зібраної веб-сторінки
    • Функція редагування тексту / HTML, що нагадує Примітки Opera
  • ScrapBook Plus

    Різниця між ScrapBook Plus і ScrapBook:

    • швидше сортування
    • швидше імпорту та експорту
    • відкрийте вікно, щоб керувати своєю колекцією безпосередньо з бічної панелі
    • спростила обробку "майстра поєднання"
    • нові функції для "Захоплення декількох URL-адрес" (фільтр для виключення посилань. Використовуйте заголовок веб-сайту або заголовок посилання як новий заголовок для запису на бічній панелі, вкажіть час очікування для завантаження від 0 до 3 секунд, використовуйте UTF-8 або ISO-8859-1 як набір символів)
    • нове вікно "Захоплення" (завантаження потрібно починати вручну, автоматичне прокручування вимкнено)
    • 6 підсвічувачів у редакторі
  • UNMHT

    дозволяє переглядати файли формату веб-архіву MHT (MHTML) та зберігати цілі веб-сторінки, включаючи текст та графіку, в один файл MHT

  • Кишеньковий (не розширення; вбудована функція Firefox)

    дозволяє зберегти веб-сторінки та відео в Pocket лише одним клацанням миші. Кишенькові смужки позбавляють ваги і зберігають сторінку в чистому вигляді, не відволікаючи увагу, і дозволяють отримувати доступ до них в дорозі через додаток Pocket.

    Зауважте, що:

    Для збереження та доступу до списку Pocket у Firefox потрібне підключення до Інтернету. Перегляд в режимі офлайн можливий на інших пристроях за допомогою програми Pocket.


0

Ви можете завантажити цілий веб-сайт або частину веб-сайту за допомогою wget.

wget -r http://docs.python.org/

Перегляньте посібник з wget для інших параметрів, які ви можете пройти, наприклад, обмежити використання пропускної здатності, контролювати глибину рекурсії, налаштувати списки виключень тощо.

Іншим підходом до перегляду в режимі офлайн є використання проксі-кешування. Wwwoffle - це безліч функцій для полегшення збереження для перегляду в режимі офлайн, такі як переопрацювання визначених сервером термінів придатності та можливість рекурсивного попереднього вибору. (Я використовую wwwoffle з моїх телефонних днів.)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.