Я дослідив відповідь на це питання таким чином: використовуючи Google, оскільки це є приклад, який я маю, як Google отримує дати створення та змінені дати та формати дат, які Google розпізнає. Будь ласка, розумійте, що ця інформація існує не лише на кількох сторінках, і мені довелося витягувати дані з дуже багатьох джерел, деякі з яких, здається, не застосовуються безпосередньо і складають їх разом. У деяких випадках інформація отримується з декількох джерел і не завжди цитується.
Google шукає дати сторінки в такому порядку; URL-адреса, тег заголовка, тіло (вміст), метатеги, заголовок відповіді HTTP принаймні, що стосується пошукового пристрою Google. В інших параграфах в інших документах жодне розпорядження не було задокументоване, проте список обговорювався і, здається, підтверджує список. Якщо ви подумаєте про це, це відображає порядок, який шукала б пошукова система; один - відкрийте свою сторінку (посилання), а два - прочитайте сторінку зверху вниз (заголовок, тіло та метатег) за винятком метатегів (невелика деталь) та заголовка відповіді HTTP. Ось перелік щодо приладу:https://developers.google.com/search-appliance/documentation/68/admin_crawl/Preparing#docdaterule
Примітка. Дата початку - це дата, коли сторінку вперше запросив Google. У разі відсутності дати створення використовується дата початку.
1] Будь-яка пошукова система може запитувати ресурс через HTTP GET-запит, і веб-сервер повертає останню змінену дату в заголовку відповіді з ресурсом у пакеті даних.
2] Будь-яка пошукова система може запитувати інформацію заголовка ресурсу через HTTP HEAD-запит, і веб-сервер повертає змінену дату в заголовку відповіді без ресурсу в пакеті даних.
3] Будь-яка пошукова система може запитувати, якщо ресурс був змінений з певної дати, подавши запит на ресурс із HTTP GET з if-modified - з моменту встановлення дати. Якщо ресурс був змінений з моменту встановлення дати, веб-сервер відповідає у відповідь 200 Ок і повертає ресурс або якщо ресурс не змінено з моменту встановлення дати, веб-сервер відповідає 304 Не змінено без повернення ресурсу .
Google робить багато запитів, використовуючи метод №3 для економії на пропускній здатності. Ви побачите їх у файлах журналу веб-сервера.
Примітка. Можливо, що система управління вмістом (CMS) або інше програмне забезпечення не можуть надати відповідну дату в заголовку відповіді.
Ці приклади дат також походять з документації на пристрій Google, але вони також існують в інших місцях, що стосуються загального пошуку. Я взяв ці деталі з документації на пристрій просто тому, що її можна було вирізати та вставити як список, де в інших місцях це було не так охайно.
4] Google шукає дату в межах URL-адреси. Він шукає наступні формати; YYYMMDDHH - YYYY - YYYYMM.
5] Google шукає дату в тезі заголовка. Він шукає наступні формати; YYYMMDDHH - YYYY - YYYYMM, хоча я підозрюю, що інші формати можуть бути розпізнані. Дивіться нижче.
6] Google шукає дату в тезі (темі). Він шукає наступні формати; YYYMMDDHH - YYYYMMDD - YYYYMM - YYYY - DDMMYYYY - YYMMMDD - MMDDYYYY - YYMMDD - DDMMYY - MMDDYY, хоча я підозрюю, що інші формати можуть бути розпізнані. Дивіться нижче.
Примітка. Відомо, що Google шукає саме дату під першим H1
тегом. Це тому, що блоги часто ставлять дати в цьому місці.
7] Google шукає метатег, як цей. <meta http-equiv="last-modified" content="YYYY-MM-DD@hh:mm:ss TMZ" />
Крім того, Google розпізнає такі формати дати.
YYYY-MD - YYYY.MD - YYYY / M / D - MD-YYYY - MDYYYY - M / D / YYYY - YY-MM-DD - YY.MM.DD - YY / MM / DD - WK, D MON, YR - WK, MON D, YR - D MON, YR - MON YYYY - MON D, YR - MON YY - YYYY-DM - YYYY.DM - YYYY / D / M - DM-YYYY - DMYYYY - D / M / YYYY - DD-MM-YY - MM-DD-YY - DD / MM / YY - MM / DD / YY - YYYYMMDDHH - YYYYMMDD - YYYYMM - YYYY - DDMMYYYY - MMDDYYYY - YYMMDD - DDMMYY - MMDDYY
Знайдене нами дослідження не дало відповіді на питання про час.
У випадку цитованих прикладів сторінки не містять підказки щодо дати, за винятком тегів, що можуть бути проігноровані. Можливо, що програмне забезпечення / веб-сервер SE не може повернути дати створення та зміни в жодному заголовку відповіді.
Чому і як Google отримав ці дати, є хорошим питанням, яке ніколи не може бути вирішене. Я все одно буду шукати.