Чи сканує Google сайти Drupal у режимі обслуговування?


10

Я використовую Aegir для клонування копій свого сайту під назвою субдомена, тобто test.mydomain.com. Ці копії знаходяться в режимі обслуговування, щоб уникнути спамерів та сторонніх очей. Потім я використовую ці копії для проведення тестів та розробок, перш ніж вносити зміни до мого головного сайту mydomain.com

Але чи шкода мені SEO через існування цих клонованих сайтів? Чи сканує google сайти, які переведені в режим обслуговування? Чи покарає мене за те, що я маю стільки субдоменів у глухий кут?


3
Це питання видається поза темою, оскільки йдеться про внутрішні алгоритми Google, а не про щось, що стосується Друпалу, або те, що ми коли-небудь можемо знати зі значним рівнем впевненості.
Молот

7
@ Mołot Як це не може бути темою? Режим обслуговування - це особливість Drupal. Існують методи правильного поводження з цим сценарієм. Питання, чи правильно робить Drupal, корисне майбутнім читачам.
mpdonadio

2
@MPD, принаймні частина "Чи покарає мене за те, що я маю стільки тупикових субдоменів", абсолютно не пов'язана з Drupal. Способи, в яких Google може бути спрямований на сторінку в режимі обслуговування, в першу чергу, також не пов'язані з Drupal.
Молот

Відповіді:


21

Коли ви переведете сайт Drupal в режим технічного обслуговування, не адміністратори бачать сторінку стандартного режиму обслуговування (припускаючи, що ви очистите кеші після цього). Якщо ви вивчите відповідь, ви побачите, що вона надсилається назад з кодом статусу HTTP 503, який із RFC 2616 :

503 Сервіс недоступний
Сервер наразі не в змозі обробити запит через тимчасову перевантаження або обслуговування сервера. Мається на увазі, що це тимчасовий стан, який буде полегшений після деякої затримки. Якщо відомо, тривалість затримки МОЖЕ бути вказана у заголовку "Повторний запуск". Якщо не вказано повторного повтору, клієнт ДОЛЖЕН би обробляти відповідь так, як це було б для відповіді 500.

І з офіційного блогу веб-майстрів Google :

Якщо мій сайт працює на технічному обслуговуванні, то як я можу запропонувати Googlebot повернутися пізніше, а не проіндексувати сторінку "вниз для обслуговування"?
Ви повинні налаштувати ваш сервер для повернення статусу 503 (мережа недоступна), а не 200 (успішно). Це дозволяє Googlebot знати, щоб спробувати сторінки знову пізніше.

Таким чином, це свідчить про те, що Drupal робить все правильно, і що Google перегляне ваш сайт та індексує сторінки наступного разу, коли отримає код не 5XX.


2
Сторінка входу користувача продовжить повертати код статусу 200 ОК (а також відображати блоки та такі, які зазвичай не відображаються в режимі обслуговування ( # 722434 )); проте robots.txt має директиву Disallow: для сторінки входу, тому добре сприйняті боти все одно не індексуватимуть її.
Гаррет Олбрайт

Це хороший момент щодо самої сторінки технічного обслуговування. Код відповіді 503 означає, що Google не індексує цю сторінку обслуговування.
Девід Томас

6

Якщо ви щось не зробили на замовлення, Google не може сканувати ваш сайт у режимі обслуговування.

Оскільки для перегляду вам потрібно увійти, googlebot побачить призначену сторінку обслуговування.

Щоб отримати додаткові вказівки від Google, перегляньте наступні посилання:


Я думаю, що справа в тому, що ви не хочете, щоб Google проіндексував сторінку обслуговування.
Fuzzy76

2

Ваші проблеми:

Якщо ви не знаєте, чи режим обслуговування блокує "все, що ви хочете, заблоковано" на 100% (!) - але в той же час дуже стурбований "чи може хтось, як Google, все-таки отримати доступ до нього". ... тоді режим технічного обслуговування може бути поганим вибором для блокування вашого сайту розробки в першу чергу.

Рекомендація:

Особисто я рекомендую просто додати .htpasswd на свої веб-сайти розробників.

Автоматизувати навіть всередині аегірських розгортань просто. Це ніколи не заважає вам, тому що ваш веб-переглядач і кожен інструмент командного рядка можуть пропустити його за вас. Ви можете дозволити іншим людям. Він блокує сайт у повноті на 100% для Google і т.д.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.