Одним із завдань було б запустити wget через проксі-сервер. Встановіть проксі для заборони певних шаблонів. Це заблокувало б, щоб Wget не завантажував їх в першу чергу.
wget завантажить та видалить файл, що відповідає шаблону -R. він також може відповідати шаблонам, а не лише розширенням або частинам імен файлів. Однак це не перешкоджає завантаженню wget спочатку та видаленню пізніше.
httrack має деякі приємні функції, але, на мій досвід, спосіб, коли він зберігає "файл", може бути трохи химерним, наприклад, якщо httrack трапляється через index.asp? type = BASIC & PAGEID = 2234234,
він може зберегти його, але вам потрібно сказати, щоб зберегти частини запиту,
наприклад,% h% p /% n% [TYPE: @TYPE = ::]% [PAGEID: PAGEID = ::].% t
@ є заповнювачем місця знака питання, ви можете перейменувати файли пізніше, чи, можливо, замість цього уникнути знака питання? Проблема полягає в тому, що.% t додасть ".html" до кінця вашого URI, у якого спочатку не було ".html". Якщо ви знімете його, зображення, які завантажують httrack, не матимуть розширення для файлу.
Краще використовувати wget IMHO