Як я можу змусити wget завантажувати лише сторінки, а не зображення css тощо?


10

Я хочу завантажити весь веб-сайт за допомогою wget, але я не хочу, щоб wget завантажував зображення, відео тощо.

я намагався

wget -bqre robots=off -A.html example.com –user-agent=”Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6″

але коли я це роблю, він не завантажує .php файли, просто завантажує статичні .html файли.

Чи є рішення цієї проблеми з wget?

Відповіді:


6

Ви чітко сказали wget приймати лише ті файли, які мають .htmlсуфікс.

Припускаючи, що на сторінках php є .php, ви можете це зробити:

wget -bqre robots=off -A.html,.php example.com –user-agent=”Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6″

Зауважте, що це завантажить відредагований html, а не джерело php. Якщо сторінка є достатньо динамічною, можливо, ви не отримаєте очікуваний результат.

Однак я б припустив, що інший інструмент, такий як httrack, може зробити кращу роботу - це залежить від того, що саме потрібно зробити.


3

-А бере список, тому -A.html, .php повинен відповідати законопроекту. Ви також повинні заглянути в -R (він також приймає список відхилень).


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.