Wget перезаписує файли під час відображення багатомовного веб-сайту


1

Я хотів би віддзеркалити веб-сайт за допомогою wget. Проблема полягає в тому, що на веб-сайті є декілька мутацій мови, які перемикаються за допомогою парам-рядків запитів, і коли wget починає завантажувати іншу мовну версію, він клобує попередню. Наприклад, він починається з index.html, захоплює частину сайту, потім наштовхується на посилання на index.html? Lang = foo, починає завантажувати новий варіант мови та замінює попередній index.html на новий. Що я можу зробити, коли хочу їх усіх?

Відповіді:


1

Оскільки сторінки насправді однакові, я не надто впевнений ...

Ви можете спробувати HTTrack, який є дуже гнучким копіювачем веб-сайтів, і ви можете налаштувати такі правила, як виключення шляхів / сторінок певним рядком запиту ... Або він може фактично мати можливість завантажувати всі мови, я не впевнений на 100%. не стикайтеся з цією проблемою.


Це допомогло, дякую. Схоже, я міг би завантажувати на сайті один варіант мови одночасно і виключати посилання, що ведуть до іншого.
Зуль
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.