Чи карає Google щоденно оновлювані теги <lastmod> у мапах сайтів, якщо дані не оновлюються щодня?


10

У мене є мапа сайту, яка створюється щодня з великою кількістю посилань на сторінки продуктів. Ці продукти щодня імпортуються з іншого джерела даних. Оскільки оновлення складається з викидання всієї поточної інформації про продукт та заміни його новою імпортованою інформацією, остання змінена дата завжди підскакує один день. Це також використовується в мапі сайту. Навіть для продуктів, які не змінилися. Усі сторінки товарів роблять вигляд, що оновлені.

Чи буде Google штрафувати веб-сайт за те, що роблять вигляд, що сторінки змінюються з дня на день, поки їх немає?

Моє рішення полягало б у тому, щоб змінити запис лише у тому випадку, якщо нові імпортовані дані про продукт відрізняються від попередніх даних. Я просто хочу переконатися, що це корисне оновлення, хоча я також можу витратити свій час на інші вдосконалення.

Відповіді:


5

Я ніколи нічого не чув про штраф через це. У гіршому випадку ви витрачаєте час на павука, але це частина того, чому у нас в першу чергу комп’ютери: робимо стомлюючі повторювані речі. Але в ідеалі ви повинні вирішити це питання.

Цей ...

Моє рішення полягало б у тому, щоб змінити запис лише у тому випадку, якщо нові імпортовані дані про продукт відрізняються від попередніх даних.

... це те, що ви повинні робити в першу чергу, незалежно від зовнішніх міркувань, таких як мапи сайту тощо. Якщо ваш вміст не відрізняється (і я б включав видалення та заміну однакової інформації в цьому описі), то ваша lastmodдата не повинна бути не змінюються. Тут ви витрачаєте власні ресурси. Ви не сказали, скільки продуктів бере участь, але буде такий момент, коли цей процес стане повільним і обчислювально дорогим.


Я цілком погоджуюся. Однак я буду впевнений у іншій компанії, яка надає дані. Вони завжди надсилають кожен товар (+200) під час експорту даних. Тож оновлення партії здавалось найкращим рішенням кілька років тому. Мій клієнт не має бюджету, щоб правильно це вирішити. Ці екс-імпорти трапляються вночі, тому додатково використані ресурси наразі не є великою проблемою.
Витребувати

@Elicit, якщо у вас все ще виникає проблема, просто збережіть експорт даних за попередній день у їх оригінальному, розбірливому форматі та зробіть порівняння у стилі git diff, щоб побачити, які продукти змінилися. Хоча це приємно, вони вам не потрібні, щоб надсилати вам лише змінені продукти; ви повинні самі вміти це зрозуміти.
Анонімний пінгвін

3

Мені ніколи не подобалася ідея оновлення <lastmod>кожного дня, оскільки це не просто неправильно, це вводити в оману пошукові системи.

У публікації про SO Гарі Ілліс від Google написав:

Тег lastmod необов’язково в мап-картах, а в більшості випадків пошукові системи ігнорують його, оскільки веб-майстри виконують жахливу роботу, зберігаючи його точно.

Я взагалі виступаю за те, щоб <lastmod>правильно використовувати або взагалі не використовувати. Залишаючи його (як і <changefreq>& <priority>) навіть робить сам файл меншим і швидшим для читання пошукових систем.


2

Ні. Google використовуватиме lastmodяк підказку (так само, як і всі значення мапи сайту), але якщо він вирішить, що ваш вміст не оновлюється щодня, він просто проігнорує його та перегляне ваші сторінки за власним розкладом.


2

Я не працюю в Google, і не можу точно сказати, що вони насправді роблять, але розумним способом поводження з ними <lastmod>мітки було б як підказки не витрачати час на повторне сканування сторінок, які не змінилися.

Тож якщо ви повідомляєте про всі свої сторінки щоразу зміненими, Googlebot просто продовжуватиме сканувати всі ваші сторінки у будь-якому порядку, а не лише зосереджується на змінених сторінках. Насправді це так, як ніби ви взагалі не повідомляли жодних часових позначок модифікації.

Основна причина надання правильних <lastmod>часових позначок - це зробити так, щоб зміни вашого сайту швидше відображалися в індексі Google. Якщо у вас на сайті сотні сторінок, Google пройде певний час, щоб обскакувати їх усі та знайти будь-які зміни. Однак якщо ви скажете Googlebot, які сторінки нещодавно змінилися, він може спочатку переглядати ці сторінки, і уникнути того, щоб витрачати стільки часу на решту.

Звичайно, ви можете просто збільшити швидкість сканування Googlebot в Інструментах для веб-майстрів і сподіватися на найкраще. Але насправді не повинно бути надто важким, щоб ваш скрипт оновлення зберігав часові позначки. Наприклад, я припускаю, що ви зараз робите щось подібне:

for each product do:
    write new page content into product page file;
end do;

Якщо так, просто замініть це на щось подібне:

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;


1

Google за це не штрафує. Для того, щоб отримати штраф, вам дійсно потрібно надіти чорну шапку на дупу Google, тому не хвилюйтеся з цього приводу. Google досить швидко дізнається, чи є у вас зміна (це те, над чим вони працювали останні кілька років), і використовуватиме властивість lastmod як підказку.


1

Я пропоную вам ознайомитися з цією найкращою практикою щодо XML-файлів та RSS / Atom-каналів

Останній час модифікації

Вкажіть час останньої модифікації для кожної URL-адреси в мапі сайту XML та RSS / Atom. Останній час модифікації має бути останнім разом, коли зміст сторінки змістовно змінюється. Якщо зміна має бути видно в результатах пошуку, то час останньої модифікації повинен бути часом цієї зміни.

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

Обов’язково правильно встановіть або оновіть час останньої модифікації:

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.

Дякую за оновлення Сподіваємось, що голосопад побачить це і відмінить свій голос.
Джон Конде
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.