Я намагаюся відобразити дзеркальний дзённік, наприклад www.example.com
, с wget
.
Я використовую wget із наступними параметрами (змінні оболонки правильно замінені):
wget -m -p -H -k -E -np \
-w 1 \
--random-wait \
--restrict-file-names=windows \
-P $folder \
-Q${quota}m \
-t 3 \
--referer=$url \
-U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
-e robots=off \
-D $domains
-- $url
Блог містить зображення, які знаходяться в інших доменах.
Навіть незважаючи на те, що я вказав -p
опцію (завантажувати пов’язані сторінки), ці зображення не завантажуються, якщо я не вказав у домені явно кожен домен -D
.
Якщо я пропущу -D
параметр, то wget буде переходити за кожним посиланням зовні www.example.com
та завантажувати весь Інтернет.
Чи можна wget
просто переходити за кожним посиланням під www.example.com
і завантажувати потрібні активи кожної сторінки, чи перебувають вони в одному домені чи ні, без того, щоб я мав чітко вказати кожен домен?
-D $domains
як і як -H
. Без -H
нього він повинен залишатися у вашому домені, але все-таки отримувати активи прямої сторінки, навіть якщо вони перебувають на іншому домені.
wget -N -E -H -k -K -p
першим і придумав сценарій, щоб отримати відсутні зв'язані зображення.