Чи є якісь чіткі показники того, що мій файл Sitemap корисний?


73

Нещодавно я створив файл sitemap.xml і завантажив його в мій обліковий запис Інструментів для веб-майстрів Google . Google не повідомив жодних проблем або помилок із завантаженим мапом сайту мого сайту.

Тепер моє питання:

  • Як дізнатися, чи працює моя карта сайту в Інструментах Google для веб-майстрів?

Причина, яку я запитую, - це те, що я не знаю, що я вважаю, бачу чи шукаю, і здається, я завантажив марний файл.

Відповіді:


93

Файл Sitemap допомагає пошуковим системам знаходити нові та оновлені URL - адреси на своєму сайті. Зокрема, якщо ваш веб-сайт досить великий, то це може допомогти їм зосередитись на новому та оновленому вмісті, замість того, щоб сліпо переглядати все, щоб побачити, чи щось змінилося. Це може призвести до того, що новий вміст знайдеться набагато швидше, що може бути досить помітно, особливо якщо веб-сайт більший або складніший.

Зокрема, Google (я працюю в Google; я не знаю, як інші пошукові системи справляються з цим), він також виконує такі дії:

  • Знайдіть кількість індексованих URL-адрес для свого веб-сайту: Ця статистика перераховується щодня і дуже точна. Ви можете знайти їх на сторінці детальних даних про Sitemap .
  • Виявіть проблеми канонізації: Якщо цифри там не збігаються , це часто знак того, що ви вказуєте URL-адреси у файлі мапи сайту, які не відповідають тому, що ми знаходимо під час сканування. Зазвичай це знак того, що вам потрібно працювати над канонізацією .
  • Довідка щодо канонізації: Коли ми знайдемо на вашому веб-сайті кілька URL-адрес, які містять однаковий вміст, ми надамо будь-якій URL-адресі, вказаній у мапі сайту, додаткову грань, навіть якщо ви не використовуєте інші методи канонізації.
  • Знайдіть погано проіндексовані частини свого веб-сайту: ці рахунки подаються за файлом Sitemap, тому ви можете створювати окремі файли мапи сайту для логічних розділів вашого сайту, щоб виявити області, де Google не індексує стільки, скільки хочете.
  • Визначення пріоритетів помилок сканування: у розділі помилок сканування URL-адреси, вказані у файлах Sitemap, перераховані окремо. Оскільки ви спеціально надали ці URL-адреси, ми припускаємо, що ви хочете їх індексувати, і що будь-які помилки сканування там важливі.

Крім того, ви можете використовувати кілька розширень у файлах Sitemap (наприклад, для зображень, відео, новин чи інтернаціоналізації), якщо ви вирішите це зробити. Усі ці розширення необов’язкові.

Для більшості веб-сайтів найбільш видимим елементом файлів Sitemap є те, що ви можете бачити індексовану кількість URL-адрес. Це може зайняти день або близько того, тому якщо ви тільки що подали мапу сайту вперше, можливо, вам доведеться бути трохи терплячими. Хоча інші способи (наприклад, сайт: -запит) є дуже-дуже грубими наближеннями, цей підрахунок є надзвичайно точним.

Відредаговано, щоб додати: ще одна річ, яку я особисто вважаю надзвичайно корисною щодо Sitemaps, - це те, що якщо ви не генеруєте їх безпосередньо зі своєю CMS, ви незмінно дізнаєтесь багато про те, як сканувати ваш веб-сайт та які URL-адреси відкриті під час цього процесу. Я бачив багато випадків, коли сканування веб-сайту з інструментом на вашій стороні (наприклад, генератор Sitemaps) буде міхувати проблеми, які ви можете пропустити інакше, будь то ідентифікатори сеансу в URL-адресах, дублювання вмісту через різниці в URL-адресах, нескінченний пробіл (наприклад, як нескінченні календарі) або навіть частини веб-сайту, які взагалі не пов’язані.


Чудова інформація. Я також чув, що на деяких веб-сайтах з великим трафіком, які сильно обробляються, краще не використовувати мапу сайту, оскільки Google робить кращу роботу сканування, і якщо у вашій мапі сайту щось не вистачає, вона може перестати індексуватися.
Chris_O

3
@Chris_O Ви разом вирішуєте різні проблеми. У цьому прикладі справа не в тому, що Google виконує "кращу" роботу, повзаючи самостійно; карта сайту несправна. Це не прямий рядок аргументів, щоб "взагалі не використовувати мапу сайту". Вирішення такої ситуації - виправити мапу сайту. Крім того, мапи сайту є інформативними, а не директивами. Щось не вистачає в мапі сайту, це не означає, що Google не знайде його самостійно або не буде ігнорувати його.
Су ’30

На цьому сайті розміщено понад 40 тис. Проіндексованих сторінок, а новий вміст індексується менш ніж за 5 хвилин (без мапи сайту). На основі вашої відповіді ми розпочнемо їх будувати і розбивати на роки.
Chris_O

@ john-mueller привіт містер. м. - Я колись подав тестову мапу з 1000 URL-адресами, ми отримали назад кількість індексів близько 700, зараз ми протестували всі 1000 URL-адрес через сайт: www.complete.org/url/to/the/page.html, ми повернулися кількість рахунків нижче 700 URL-адрес (більше в області 200). що це значить?
Франц

2
@Franz Іноді задіяні деталі, які ускладнюють відтворення індексованої кількості URL-адрес на сайті: -queries. Наприклад, бувають ситуації, коли ми можемо комбінувати кілька URL-адрес і показувати лише один із них для сайту: -query. Тож якщо ви бачите різницю там, хвилюватися зазвичай не варто.
Джон Мюллер

6

Якщо ви не отримуєте жодних помилок, ви можете припустити, що Google їх проаналізував і знає про вміст. Але це не означає, що вони будуть сканувати та / або індексувати ці сторінки. Мапи сайту - це ще один спосіб повідомити пошукові системи про ваші сторінки. Вони не зобов’язані сканувати та індексувати будь-яку чи всі ці сторінки. Те саме стосується пошуку сторінок за допомогою посилань або подання URL-адрес.


1
Як додана інформація, досить легко зрозуміти, чи Google розуміє мапу сайту. Перевірте в розділі Оптимізація -> Мапи сайту. Він підкаже, скільки URL-адрес було надіслано в мапі сайту. Мапа сайту успішно прочитає вміст і знайшов у ньому багато посилань. Друге число - скільки індексовано, і, як зазначає Джон, повністю залежить від Google, чи вважає вони жодним, деяким чи більшою частину вашого вмісту вартим. Завжди вона буде меншою, ніж подана сума, Google просто вважає, що деякі сторінки не дуже гарячі і не турбує їх.
Лабораторії Фіаско

1

Google, як правило, добре працює з скануванням вашого веб-сайту, якщо у вас є велика кількість якісних посилань. Якщо ви витрачаєте багато часу на перегляд кількості проіндексованих вами сторінок, я б запропонував краще покращити ваш сайт та отримати якісні посилання.


0

Можливо такий інструмент перевірки мапи сайту, як цей , хоча я ніколи не бачив, щоб карта сайту почала запускати.


Файл уже підтверджено. Це не питання.
Су ’27

0

Для більшого веб-сайту, наприклад веб-сайту із сотнями, тисячами чи мільйонами сторінок, це досить корисно. У нас на сайті компанії було 400 000 сторінок, на яких URL-адреси динамічно створювались за допомогою ідентифікатора вмісту та параметрів URL-адреси, використовуючи &, Інструменти Google для веб-майстрів нададуть вам зворотній зв’язок на сканованих сторінках та покажуть вам помилки, ви можете налагоджувати або відкривати сторінку та подивіться самі, що не так. Таким чином Google насправді допоміг нам зробити кращий веб-сайт і в кілька разів позбавив нас від величезного збентеження.

Також корисно побачити кількість індексованих сторінок та кількість сканованих сторінок.

Для менших веб-сайтів, якщо веб-сайт є невеликою групою .html сторінок, де кожна сторінка пов’язана через меню, а сайт не часто оновлюється, якщо ви завантажуєте мапу сайту, нічого не зміниться щодо результатів пошуку. Ви не матимете жодної переваги над завантаженням карти сайту для когось, хто не завантажував мапу сайту.

Також у мене було близько 20 невеликих веб-сайтів, на яких у мене були автоматичні карти сайтів, створені за допомогою cron script, і я перестав це робити. Одного разу я дізнався, що файли XML не генеруються правильно протягом моєї помилки протягом приблизно 6 місяців, але Google вдячно проігнорував мою помилку та повністю проіндексував ці веб-сайти навіть тоді, коли в мапах сайту були помилки, Google використовує мапу сайту лише як підказку, куди йти, а не дуже серйозно.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.