Чи має сенс повернути 410 замість 404, коли якусь сторінку остаточно видалено?


16

Чи має сенс повертати 410замість того, 404коли якусь сторінку остаточно видалено? У цьому відео Метт Каттс каже, що Google ставиться до них так само, але чи є інші причини для впровадження 410(крім технічної коректності)?


Я сам про це задумався. Здається, що 410 просто більше ніде не використовується.
wogsland

Відповіді:


7

На нашому веб-сайті нещодавно було застосовано 410 помилок для сторінок, які були видалені назавжди. У індексі Google у нас близько 40 мільйонів сторінок, і Googlebot отримує 2 мільйони запитів на день.

Після очищення нашої бази даних ми виявили велику кількість 404 помилок, які відображаються в Помилках сканування в Інструментах для веб-майстрів. Коли ми перейшли до 410 статусів замість 404, кількість помилок на день скоротилася вдвічі, тоді як загальна кількість виконаних запитів залишилася приблизно однаковою. Тож це в кінці кінців успішніше сканувати сторінки. Схоже, сторінки зі статусом 404 проскакують кілька разів, перш ніж їх повністю видалити з індексу.

Тож я б сказав, так, безумовно, варто використовувати 410, де це доречно, щоб підтримувати бюджет Google Crawl.


11

У цьому світі є більше, ніж Google. 410 однозначно повідомляє боту, що файл зник. А 404 - ні. Наполегливий бот може продовжувати намагатися знайти 404 нескінченно, тоді як вони можуть перестати намагатися знайти 410 негайно, що зробить ваш сервер дуже щасливим.


2
Хоча це обома способами: по-справжньому хитрий бот може розпізнати лише 200 і 404.
Пітер Тейлор

4
@ Петер не впевнений, що це має значення - якщо вони лукаві і не розуміють HTTP-коди, то яка шкода це може зробити Якщо ви використовуєте 404, запити на сторінку продовжуватимуть як хитрі, так і хороші боти, тоді як з 410 - лише хитрий.
НезадоволенеГотування

1
Що сказав @DisgruntledGoat. Див . Закон Постеля . Хитрі реалізації просто неможливо врахувати; що ти збираєшся робити, спробувати і врахувати всі вони та кожну їхню особливість, і все одночасно? Є рідкісні винятки, як, наприклад, давнє домінування браузера IE6, але взагалі просто не варто докладати зусиль.
Су '

6

Окрім того, що там більше пошукових систем, ніж Google, немає також причин вважати, що Google ніколи не змінить спосіб обробки 410 відповідей. Дійсно, здається, що це вже сталося: інформація, яку цитує Метт Кеттс у відео, - з 2007 року, тоді як ця публікація від Джона Му на 2009 році на Центральних веб-форумах Google для веб-майстрів говорить про інше:

"Я брав участь у справі 404 проти 410 з командою тут. Як вже згадували деякі інші тут і в інших місцях, ми в минулому зазвичай ставилися до них так само.

Однак, подивившись, як веб-майстри використовують їх на практиці, ми зараз трактуємо код результату 410 HTTP як трохи "постійніший", ніж 404. Отже, якщо ви абсолютно впевнені, що сторінка більше не існує і ніколи більше не існуватиме, використання 410, ймовірно, буде хорошою справою ".

Таким чином, схоже, Google зараз дійсно розглядає 410 відповідей інакше, ніж 404.


4

На мій досвід, Google не розуміє 410 кодів помилок.

Деякий час тому я змінив повний сайт, тому всі старі URL-адреси "410 Зникло". Я не можу використовувати переадресацію 301, оскільки немає прямого відношення до нової URL-адреси.

Я використовував для того, .htaccessщоб повідомити Google, що старі URL-адреси зникли, але він постійно говорить про те, що на моєму сайті є ВЕЛИЧЕЗНА 405 помилок. Я перевірив URL-адреси у звіті про помилку сканування, і всі вони є 410, а не 404, як зазначено.


1

У цьому світі є більше, ніж Google.

Цитується правда. Зважаючи на вашу вимогу, щоб повідомити ботам (і, мабуть, і людям), що сторінка була видалена назавжди , я б фактично вибрав 301переспрямування на сторінку з поясненням (за необхідності), чому вміст було видалено, або взяти бота / користувача повернутися до сторінки покажчиків.

Маловідомі коди помилок HTTP зазвичай не настільки добре підтримуються, не розуміються чи не реалізуються на всій основі, тому я, як правило, дотримуюся тих, які є для того, щоб забезпечити очікуваний і, сподіваюся, безпроблемний перегляд веб-переглядачів.

Вибір того, з якою опцією перейти, залежить від того, скільки запитів ще надходить для (зараз) відсутнього вмісту.


1
Чому необхідність пояснювати видалення означає, що вам потрібно 301 для іншої URL-адреси з цим поясненням? Пояснення може бути на самій сторінці зі статусом 410, щоб пошукові системи зрозуміли, що він мертвий.
IMSoP
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.