Я намагаюся відобразити дзеркальний дзённік, наприклад www.example.com, с wget.
Я використовую wget із наступними параметрами (змінні оболонки правильно замінені):
wget -m -p -H -k -E -np \
-w 1 \
--random-wait \
--restrict-file-names=windows \
-P $folder \
-Q${quota}m \
-t 3 \
--referer=$url \
-U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
-e robots=off \
-D $domains
-- $url
Блог містить зображення, які знаходяться в інших доменах.
Навіть незважаючи на те, що я вказав -pопцію (завантажувати пов’язані сторінки), ці зображення не завантажуються, якщо я не вказав у домені явно кожен домен -D.
Якщо я пропущу -Dпараметр, то wget буде переходити за кожним посиланням зовні www.example.comта завантажувати весь Інтернет.
Чи можна wgetпросто переходити за кожним посиланням під www.example.comі завантажувати потрібні активи кожної сторінки, чи перебувають вони в одному домені чи ні, без того, щоб я мав чітко вказати кожен домен?
-D $domainsяк і як -H. Без -Hнього він повинен залишатися у вашому домені, але все-таки отримувати активи прямої сторінки, навіть якщо вони перебувають на іншому домені.
wget -N -E -H -k -K -pпершим і придумав сценарій, щоб отримати відсутні зв'язані зображення.