Якщо ви відчуваєте, що вони переповнюють ваш сайт (можливо, навіть не вистачає більш глибокого вмісту), ви повинні переконатися, що заголовки HTTP повертають хороші значення для таких речей, як "остання зміна" часу тощо. Можливо, Googlebot завищує, наскільки зміниться ваш сайт. . Як бонус ваш сайт буде вести себе краще щодо кешування (будь то проксі чи браузер) і, таким чином, відчуватиметься трохи швидше.
Ви б добре вивчили, які URL-адреси скануються (переглядаючи журнали ваших серверів). Якщо вони повторно повторюють одну і ту ж URL-адресу, у вас, безумовно, є проблема. Поширений варіант для цього - якщо у вас є сторінка, яку можна відображати різними способами, використовуючи змінні запиту. Googlbot може спробувати сканувати всі можливі поєднання цих змінних.
Приклад, з яким я стикався як оператор сканування, - це сторінка, яка мала список із двадцяти заголовків, будь-яку комбінацію яких можна розширити. В основному на цій сторінці було 2 ^ 20 різних URL-адрес!
Переконайтесь, що Googlebot не зациклюється на повзанні однієї і тієї ж сторінки з тривіально різними параметрами (я бачив, як це потрапило в це)