Я дуже сумніваюся, що опублікована дата публікації чи статті базується на <lastmod>
записі у мапі сайту XML (як це запропонували інші) або в останньому зміні заголовка HTTP з цього приводу. Карта сайту XML є лише дорадчою, а не авторитетною. Остання змінена дата документа, ймовірно, не збігається з (оригінальною) датою публікації статті. І, як я згадував у своєму коментарі вгорі сторінки, остання змінена дата документа, ймовірно, важливіша для кешування і, можливо, визначення швидкості сканування. Заголовок HTTP останнього зміну динамічно створених сторінок часто дуже близький до фактичної дати / часу (як це стосується блогів WordPress).
З іншого боку, канал RSS / Atom містить цей специфічний інформаційний елемент. І дійсно, на сайтах Wordpress, які не містять дату публікації у вмісті, дата публікації все ще відображається в результатах пошуку Google. Наскільки я можу сказати, це відповідає даті в RSS-стрічці.
РЕДАКТИКА №1: Однак RSS-канал не обов'язково містить усі сторінки. У більшості випадків він повинен містити лише останні чи останні оновлені сторінки. Але немає причин, щоб Google забував те, що він уже прочитав, а надання вмісту цієї сторінки не змінилося, як і остання змінена дата.
Якщо немає RSS-каналів, я думаю, що Google досить розумний для аналізу вмісту сторінки. Особливо, якщо дати позначаються "семантично" за допомогою мікроформатів . Цілком можливо, що Google побачить таке, як авторитетну дату опублікування для статті, в якій вона міститься:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google, безумовно, читає мікроформати - hCard, hReview тощо.
Додамо лише, що я не думаю, що Google оголошує дату публікації, якщо б не зміг знайти щось авторитетне, що б це підказало. "Дату публікації" для спекулятивних даних не збирається виводити, оскільки неправильна "дата публікації" нікому не корисна, і Google отримає багато цього!
І лише для запису (якщо @Tom пропонує інше :) Я думаю, що в публікаціях / статтях повинна бути помітно відображена дата публікації. Багато хто цього не робить, і це може засмутити читача, особливо, коли досліджуєш проблеми з технологіями, і ти вважаєш, що прочитавши статтю на півдорозі, вона застаріла!
EDIT № 2: з тих пір я відчував подібне роздратування, яке @mmdanziger детально пояснює у своїй відповіді. На одному з моїх старих сайтів у верхній частині кожної сторінки (написаний на сторінці з JavaScript !!) я маю текст форми "Останнє оновлення Сонця, 17 червня 2012 року" (не позначений спеціальним чином ). Ця сама дата була підібрана Google і тепер відображається поряд з кількома (але не всіма) сторінками, які відображаються в SERPS - це, безумовно, не дата публікації сторінки. Здавалося б, Google просто перебирає сторінку на рядок форми "останній раз оновлений ( датестринг )" ( обробивши JavaScript !!). Цей конкретний сайт не має каналу RSS. На сайті є файл Sitemap.xml, але дати відрізняються.
Я помітив подібну поведінку і на інших сайтах.