Чому Google не може знайти структуровані дані на більшості моїх індексованих сторінок?


13

У мене веб-сайт із приблизно 30 000 сторінок. Індекс Google нормально, майже всі сторінки індексуються, але в структурованих даних я бачу лише 48 сторінок, виявлених для schema.org. Schema.org ідентичний цілому веб-сайту.

Моє запитання, чому існує така велика різниця між індексованими сторінками та виявленими на сторінках розмітки?

Особливо я наполегливо працював над тим, щоб реалізувати всі відповідні схеми для свого веб-сайту, і тепер Google їх не виявляє.

Проіндексовані сторінки - понад 27 000 Структуровані дані в інструментах для веб-майстрів - 48 сторінок

Сторінки з schema.org - 48 Індексованих сторінок в інструментах для веб-майстрів - понад 27 000


5
Інструменти для веб-майстрів можуть повільно повідомляти про результати, оскільки це не в режимі реального часу, крім того, також може знадобитися кілька сканувань. Важливим питанням є те, скільки ваших URL-адрес сканує Google на місяць, я дуже сумніваюся в 27000, оскільки я б очікував побачити більшу кількість. Google завжди буде індексувати та оновлювати найпопулярніші сторінки, оскільки вони частіше сканують, деякі URL-адреси, які не оновлювались місяцями-роками, можуть тривати дні, тижні чи навіть місяці, щоб оновити ..
Simon Hayter

5
Щоб оновити те, що сказав @bybe (один голос за коментар). Google має показник стилю TTL для кожної сторінки. Якщо сторінка нова або не оновлюється часто, Google не відвідуватиме її часто. Якщо сторінка свіжа і часто змінюється, час TTL для сторінки з часом зменшується, а Google відвідуватиме її частіше. Свіжість - важливий показник у вашому сценарії. Якщо ваш веб-сайт стандартний по свіжості, то Google може зайняти зовсім небагато часу, щоб виявити зміни. Якщо ваш сайт новий, то він може перевірити свіжість за допомогою деяких пробних запитів.
closetnoc

У моєму випадку це новий веб-сайт - це можна побачити з графіки проіндексованих сторінок - це починається з серпня 2014 року. Я не прошу сканованих сторінок, а для індексованих. І я можу розраховувати на ті пункти, які ви обидва помітили, але я прошу різниці між індексованими сторінками та Сторінками з розміткою схеми. Хоча вміст можна часто змінювати чи ні, схема є частиною структури HTML. І це питання для мене дуже важливе, оскільки я починаю наполегливо працювати з schema.org для кожного свого проекту, як це рекомендує Google.
Дфучиджієв

Як я вже говорив, може знадобитися кілька сканування, і це може зайняти більше часу, щоб воно з’явилося в Інструментах для веб-майстрів. Також потрібно більше часу, щоб ці схеми з’являлися фактично в пошукових системах, тобто зірки, ціни на акції та інші вигоди, які з’являються в результатах пошуку (як правило, 2-3 місяці). Поки ваш код перевіряє нормально в тесті розширеного фрагмента, ви можете зробити мало… просто скажіть клієнтам, що це займає 2-3 місяці, і ви ніколи не повинні обіцяти, що багаті дані відображаються насправді в результатах, оскільки Google не завжди повертає дані у фактичних результатах.
Саймон Хейтер

Відповіді:


5

Ось як це працює на базі сайтів, які ми нещодавно випустили + пара, яка працює деякий час.

Якщо припустити, що його новий сайт використовує всі Schema.org, а також резервні дані-vocab для крихти та оглядає дані, вам слід очікувати принаймні 3 місяці затримки. Ви побачите звіти про схеми інструментів веб-майстрів Google, які нічого не роблять - жодних нових оглядів, нових сторінок .... навіть шипів, потім знижується кількість чи помилкових тривог. Не хвилюйтеся, його просто GADHD. Одного дня у 2-му місяці ви можете побачити, що всі рахунки починають заповнювати, вирівнювати та стабілізувати. Ви можете побачити активізацію віджетів SERP data-vocab SERP на сторінках, що торгуються людьми / свіжими. Через місяць з цього моменту віджети schema.org SERP повинні активуватися, припускаючи, що в GWT немає помилок. Ви можете помітити вперед і назад, особливо за відгуки, ціну тощо за цей час. Одного дня вони будуть увімкнено, інший - вимкнено. Один запит увімкнено, інший відключений. Врешті-решт СЕРП стабілізується,

Як зазначив closetnoc у коментарі до оригінального запитання, RDF запускається із нових фокусних даних / сторінок. Це може зайняти набагато довше, ніж 3 місяці для тих захованих сторінок, які ніколи не отримують хітів, можливо, до року для справді застарілих. Це гарна ідея освіжити області, які ви хочете запустити багаті віджети SERP. Google покаже, що вони індексуються-RDF в GWT, готові до рок-н-ролу, але фактичні віджети SERP не активуються, поки тригер не дозволить. Цей тригер свіжий / трафік / інтерес / шукає ваші "вже проіндексовані" сторінки RDF.

Будьте терплячі і очікуйте, що побачите багато флуктуацій та невідповідностей. Ось як індекс боту RDF котиться з механізмом прогнозування + поп-запитами, я думаю.


1
Повторне відвідування цієї відповіді: Схоже, статус Google+, який увійшов у систему в поєднанні з G + local для biz, впливає на те, як швидко ваші SERPS показують структуровані дані. На кінцівці вони, схоже, відслідковують соціальний + місцевий інтерес на рівні SERP і здаються більш ліберальними у багатих фрагментах, які вони там показують. Наприклад, зірки відгуків можуть відображатися користувачеві G + та будь-якому користувачеві, який не є G + у вашій місцевості. В той час, як ті самі зірки можуть пройти ще один місяць, щоб показати для решти світу, що не входить у систему. Мораль коментаря: переконайтеся, що ви налаштували G + local для своїх веб-сайтів, а потім підтвердьте себе як видавця.
dhaupin

Зауважте, що мої інструменти для веб-майстрів почали показувати мої структуровані дані через 6 днів після того, як вони з'являться на моєму веб-сайті, так що це, можливо, тепер покращилося
Метт Вілько
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.