Як дізнатися, коли певна URL-адреса була вперше індексована Google? Я вважаю за краще рішення, яке працює навіть для URL-адрес конкурентів, які не належать мені.
Як дізнатися, коли певна URL-адреса була вперше індексована Google? Я вважаю за краще рішення, яке працює навіть для URL-адрес конкурентів, які не належать мені.
Відповіді:
Щоб дізнатися вік URL-адреси, ви можете перейти за цим посиланням, замінивши www.example.com
потрібну URL-адресу:
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
Наприклад, ось результат від Google для Meta на сайті переповнення стека :
Інакше машина Wayback - це також хороше рішення, але менш точне з мого досвіду.
.fr
на .com
.
www
і в цей час, він показує результат для дати, Dec 1, 2014
яка є зовсім недавньою датою, яка не може бути віком URL-адреси. Я шукаю неправильно? чи нічого не вистачає?
Zistoloen знайшов спосіб Google відображати дату, коли він вперше індексував вміст сторінки. Я додаю це до своєї відповіді, бо думаю, що можу пояснити це більш чітко.
Потім Google покаже дату, коли виявив вміст, який знаходиться на сторінці в результатах пошуку.
Якщо сторінка оновлюється новим вмістом, Google також оновлює цю дату. Тож це скоріше дата "першої індексованої цього вмісту", а не дати "вперше індексованої цієї URL"
Кеш-пам’ять Google для сторінки показує, коли вона останньо індексована. Ви бачите, що домашня сторінка Stack Exchange була останньо індексована сьогодні:
Інший варіант - використання машини Wayback Internet Archive . Це показує, як виглядала сторінка в минулому. Ви можете зрозуміти, коли сторінки були опубліковані вперше. І Google, і Інтернет-архів сканують та використовують сторінку незабаром після її публікації.
bing.com
. Вибачте, якщо я помиляюся?
Там не може бути якийсь - небудь спосіб , щоб з'ясувати , коли довільний веб - сторінка була першим індексується Google - звичайно , я не знаю ні одного способу зробити це. Цілком можливо, що Google просто не зберігає цю інформацію, оскільки немає реальної причини, чому б їм це потрібно. Крім того, навіть якщо вони зберігають цю інформацію, вони справді не мають особливих причин робити її вільно доступною для третіх сторін.
(Якщо це ваша власна сторінка, і ви маєте доступ до своїх старих журналів доступу до веб-сервера, це просто - просто шукайте в журналах перший візит від Googlebot на цю сторінку. Але в іншому випадку, можливо, це точно немає.)
У будь-якому випадку метод, описаний Зістолоен та Стівеном Остерміллером у своїх відповідях, як правило, не розкриває дату, коли певну URL-адресу вперше індексував Google. Швидше, це показує дату, коли Google вважає, що вміст за URL-адресою було опубліковано або востаннє оновлено, і часто базується на більш-менш надійних спробах Google "обнюхати" дати з самого вмісту сторінки.
У цьому відео Matt Matt Cutts коротко торкається того, як обираються ці дати. Для зручності я переписав відповідний фрагмент відео (приблизно з 2:09 до 2:22) нижче:
"... часто ви бачите дату, коли ми робимо її висновок, або коли ми вперше бачили її, коли ми проскакували цю сторінку, або якщо ми можемо знайти її десь на сторінці, і ми можемо витягнути цю дату, ви" Це побачимо на самому початку фрагмента ".
Для таких сторінок, як публікації в блогах, вікі-сторінки або питання Stack Exchange, де програмне забезпечення, що працює на веб-сайті, автоматично повідомляє точну дату створення / модифікації на самій сторінці, дата, про яку повідомляє Google, швидше за все, відповідатиме їй. Однак для інших типів сторінок нюх дату Google повинен працювати більше, і це не завжди підходить правильно (що б "правильне" могло означати в цьому контексті).
Зокрема, ці дати в основному марні для визначення того, як давно сторінка була індексована з двох причин:
Якщо сторінку нещодавно було змінено, а дата модифікації відображається помітно на сторінці, Google може вибрати її як "дату" сторінки, навіть якщо модифікація була повністю тривіальною.
Наприклад, ця досить стара вікі-сторінка (яку вперше індексували archive.org у 2003 році ) Google наразі визначає як дату від 10 листопада 2014 року - дату останнього редагування, як показано внизу сторінки. Зміна, що сталася в цю дату? Просто видаліть одне посилання знизу сторінки.
І навпаки, Google, здається, рада прийняти дуже старі "дати публікації", якщо знайде їх на сторінці - навіть ті, що передували запуску всесвітньої павутини .
Наприклад, ця сторінка старого конкурсу програмування датується Google 15 вересня 1986 року - фактично датою події, описаною на сторінці. Аналогічно, ця сторінка, яка документує студентський страйк в 1970 році , датується Google 10 травня 1970 року (дата одного зі сканованих документів на сторінці), і, що ще більш абсурдно, ця сторінка з керівництвом Linux датується Google 4 листопада. , 1989 р. (Випадкова прикладна дата, використана на сторінці).
Ви можете знайти ще багато таких прикладів, використовуючи користувацький пошук діапазону дат, описаний Стівеном та Зістолоен, але встановивши верхній кінець діапазону до, скажімо, 6 серпня 1991 року .