Як я можу отримати доступ до прихованих дат на заархівованому веб-сайті? [зачинено]


-3

Для передмови я маю абсолютно нульові знання щодо програмування. Я хочу зробити доступ до 17 дат, які не відображаються на цьому заархівованому веб-сайті: https://web.archive.org/web/20031002051647/http://www.avengedsevenfold.com:80/tourdates/tourdates.php (і, звичайно, приховані дати на старих / новіших версіях цього веб-сайту)

Коли я натискаю "Далі" або "Показати всі дати", він просто перезавантажує веб-сайт. Чи є спосіб отримати дати? Я проглянув вихідний код, але нічого не знайшов. Але дати мають бути десь, правда?

Відповіді:


1

Вони не заархівовані.

Інтернет-архів не має доступу до логіки веб-сайту на стороні сервера і не може повністю повторити поведінку динамічних сторінок (наприклад, PHP у цьому випадку); найкраще, що можна зробити, це перейти за посиланнями та завантажити кожну відому URL-адресу як незалежну, статичну сторінку.

Сканер може слідувати та архівувати прямі посилання, такі як <a href="news.php?page=2">. Однак "Наступне" / "Показати все" вашого веб-сайту не є регулярними посиланнями - це нечесна комбінація дій JavaScript та форм на основі POST, жодна з яких одна з них вже зробила б, щоб сканер не розпізнав їх як посилання:

<a href="#" onclick="JavaScript:nextPage()"><img src=...></a>

Хоча архіватор може зберігати копію коду JavaScript на стороні клієнта, він не інтерпретує цей код, ані іншим чином не розуміє, що тут робить nextPage (), і тому повинен цілком пропускати ці кнопки на базі JS. (Ви можете бачити, що IA має лише одну URL-адресу, заархівовану .)

(Навіть якщо архіватор міг би виявити, що робить код JS, не можна було б доторкатися до цієї конкретної форми - використання POST означає, що кожен запит може спричинити деякі зміни на сервері. Лише GET-запити безпечно автоматично сканувати. .)

Отже, коли ви натискаєте кнопку "наступний", браузер все ще запускає nextPage () і надсилає запит зі сторінкою = 2 або такою, але немає відповідного коду на стороні сервера, щоб обробити цей запит більше - Архів може відповідати лише ті ж статичні дані, що і раніше.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.