Нещодавно у мене був злом, який додав кілька тисяч фальшивих сторінок на мій сайт.
Я подав виправлену мапу сайту до консолі пошуку Google (раніше її називали Інструменти для веб-майстрів) і перейшов усі посилання на 410, але в Google все ще більшість з них було індексовано.
Я використовував інструменти WebMaster Tools - масове видалення URL-адреси розширення Chrome для автоматичного подання URL-адрес для видалення. В основному це сценарій, який бере список URL-адрес, а потім подає їх вам, по одній. Щоб відправити їх усі, знадобляться години, але принаймні вам не доведеться робити це самостійно. Ось стаття про те, як ним користуватися .
Ви можете отримати список URL-адрес, які Google індексує, завантаживши дані безпосередньо з консолі пошуку. Перейдіть до статусу> Покриття індексу та виберіть дійсні результати, а потім прокрутіть вниз. Ви побачите, що Google проіндексував тону URL-адрес, яких немає у вашій мапі сайту. Ви можете завантажити перші 1000 результатів. Очевидно, існує круговий спосіб отримати їх усіх, не тільки першу тисячу, але це включає дзвінки API від excel. Я просто чекав кілька днів між кожною тисячею, коли вони повільно випадали з індексу.
Інший шлях полягає у тому, щоб плагін WP створив мапу сайту, а потім відфільтрував PDF-файли або все, на що ви орієнтуєтесь. Тут вам, мабуть, доведеться трохи скопіювати / вставити / видалити вручну. Щоб забезпечити безпеку, я повільно прокручував мій список близько 2700 спам-URL-адрес і видаляв законні URL-адреси. Це зайняло лише близько 20 хвилин.
Якщо ви не намагаєтесь назавжди зняти щось, наприклад спам, а замість цього намагаєтесь придушити преміум-ресурси, слід використовувати інші методи, щоб запобігти індексації цих ресурсів, наприклад, файл роботів. Але якщо виявиться, що Google не послухав або ви кинули кулю, принаймні тепер ви можете виправити проблему та вилучити їх з індексу лише за кілька днів.
За моєї конкретної обставини мені цікаво, чому в Google немає кнопки машини часу, ані відмінити чи скинути. Ідея полягає в тому, що я можу сказати, що Google був зламаний кілька днів тому, але ми його відремонтували, тому скасуйте останнє x число днів сканування та індексації. Але це було б занадто просто.