Використання wget для копіювання веб-сайту з правильним розташуванням для автономного перегляду


4

Це правильний спосіб завантажувати веб-сайт з усіма зображеннями та файлами css так, щоб він мав такий же макет, що й оригінал, але не знаю, чому -K --backup-converted і -E --adjust-extension потрібні варіанти.

Після оновлення веб-сайту, як оновити резервну копію веб-сайту? Так само, як і для завантаження?

wget -mpHkKEb -t 1 -e robots=off -U 'Mozilla/5.0 (X11; Ubuntu;
Linux x86_64; rv:40.0) Gecko/20100101 Firefox/40.0' http://www.example.com
  • –m (--mirror) : включити параметри, які підходять для дзеркального відображення (нескінченне рекурсивне завантаження і мітки часу).

  • -p (--page-requisites) : завантажити всі файли, необхідні для правильного відображення даної HTML-сторінки. Це включає такі речі, як вбудовані зображення, звуки та посилання на таблиці стилів.

  • -H (--span-hosts): увімкніть охоплення через хости при рекурсивному отриманні.

  • –k (--convert-links) : після завантаження конвертувати посилання в документ для локального перегляду.

  • -K (--backup-converted) : при конвертації файлу створюйте резервну копію оригінальної версії суфіксом .orig. Впливає на поведінку -N.

  • -E (--adjust-extension) : додайте відповідне розширення до кінця файлу.

  • -b (--background) : перейти до фону відразу після запуску. Якщо вихідний файл не вказано через -o, вивід перенаправляється на wget-log.

  • -e (--execute) : команда виконання (robots = off).

  • -t number (--tries=number) : встановлено кількість спроб номер .

  • -U (--user-agent) : ідентифікувати як HTTP-сервер рядок агента. Деякі сервери можуть назавжди заборонити рекурсивне завантаження, якщо ви надішлете Агент користувача за замовчуванням.

Відповіді:


1
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://example.org

ive використав це раніше

від Зробити дзеркало на сайті, використовуючи wget:

Пояснення різних прапорів:

  • --mirror - Робить (серед іншого) рекурсивний завантаження.
  • --convert-links - Перетворення всіх посилань (також, щоб наповнити подібні таблиці стилів CSS) до відносних, тому вони будуть придатні для перегляду в автономному режимі.
  • --adjust-extension - Додає відповідні розширення до імен файлів (html або css) залежно від їх типу контенту.
  • --page-requisites - Завантажуйте такі речі, як CSS-стилі та зображення, необхідні для належного відображення сторінки в автономному режимі.
  • --no-parent - При рекурсії не піднімаються до батьківського каталогу. Це корисно для обмеження завантаження лише на частину сайту.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.