Я хочу отримати всі файли для певного веб-сайту на archive.org. Причини можуть включати:
- оригінальний автор не архівував власний веб-сайт, і він зараз в автономному режимі, я хочу зробити з нього загальнодоступний кеш
- Я оригінальний автор якогось веб-сайту і втратив деякий вміст. Я хочу його відновити
- ...
Як це зробити?
Беручи до уваги, що машина зворотного шляху archive.org дуже особлива: посилання на веб-сторінки вказують не на самий архів, а на веб-сторінку, яка може бути там більше не. JavaScript використовується для клієнта для оновлення посилань, але хитрість, як рекурсивний wget, не працюватиме.
gem install wayback_machine_downloader
. Запустіть wayback_machine_downloader з базовим URL-адресою веб-сайту, який ви хочете отримати як параметр:wayback_machine_downloader http://example.com
Детальніше: github.com/hartator/wayback_machine_downloader