Існують (принаймні) дві поширені причини, через які дивні та невмілі URL-адреси можуть відображатися як помилки сканування в Інструментах для веб-майстрів.
Перша можливість полягає в тому, щоб хтось скопіював ваші сторінки (або деякі інші сторінки, які посилаються на ваші) та керував ними посиланнями в процесі. Це трапляється частіше, ніж можна подумати; див., наприклад, шосте запитання в цій публікації блогу Google для веб-майстрів .
Інша можливість полягає в тому, що сам Googlebot намагається дотримуватися того, що, на його думку, є посиланнями JavaScript і створює безлад . Зазвичай ви можете розказати ці два випадки, відвідавши сторінку, що пересилається (яка повинна існувати та бути доступною, якщо Google встиг би просканувати її для початку) та шукаючи назву цільової сторінки у своєму джерелі.
Так чи інакше, ви можете зробити дві речі: або просто проігноруйте посилання, або придумайте кілька правил перезапису, щоб спробувати зіставити порушені URL-адреси на робочі. Якщо ви бачите очевидний зразок в URL-адресах і знайомі з регулярними виразами, я рекомендую останній підхід - він очистить ваш список помилок сканування і, можливо, навіть дасть вам невеликий і досить ситний, але справжній приріст PageRank .
Третій варіант, якщо ви виявите, що хтось копіював ваш вміст без дозволу, - спробувати дозволити їх вилучити . Ви навіть можете надіслати скаргу (та / або офіційний запит на зняття) до свого хостинг-провайдера, якщо вважаєте це виправданим. Звичайно, враховуючи, що вони , мабуть, посилаються на ваш сайт, вам, можливо, не обов'язково здадуться, що варто докласти зусиль.