Я помітив, що Google Webmaster Tools повідомляє про багато заблокованих ресурсів на моєму веб-сайті. Зараз усі "заблоковані ресурси" - це .css, .js та зображення (.jpg, .png), які я обслуговую із Cloudfront CDN.
Я витратив багато часу на тестування і намагався з’ясувати, чому Google не сканує ці файли і повідомляє про стан "блоку ресурсів".
В даний час я обслуговую ці файли з кількох імен хостів, таких як: cdn1.example.com, cdn2.example.com,…
cdn1, cdn2 та інші - це ім'я CNAME для розповсюдження хмарного фронту.
Тест: я намагався безпосередньо використовувати розподіл хмарних переходів (без CNAME), але проблема не зникає.
Наразі мій robots.txt виглядає так:
# Google AdSense
User-agent: Mediapartners-Google
Disallow:
#Google images
User-agent: Googlebot-Image
Disallow: /
User-agent: *
Disallow: /homepage
Disallow: /index.php*
Disallow: /uncategorized*
Disallow: /tag/*
Disallow: *feed
Disallow: */page/*
Disallow: *author*
Disallow: *archive*
Disallow: */category*
Disallow: *tag=*
Disallow: /test*
Allow: /
І приклади файлів, заблокованих на одній прикладі сторінки:
cdn1.example.com/wp-content/plugins/wp-forecast/wp-forecast-default.css
cdn9.example.com/wp-content/plugins/bwp-minify/min/?f=wp-content/themes/magazine/css/font-awesome.min.css,wp-content/themes/magazine/css/responsive .css
cdn5.example.com/wp-content/themes/magazine/images/nobg.png
cdn6.example.com/wp-content/plugins/floating-social-bar/images/fsb-sprite.png
cdn5.example.com/wp-content/uploads/2013/11/Design-Hotel-3-80x80.jpg
cdn5.example.com/wp-content/uploads/2013/11/Marta-Hotel-7-270x225.jpg
Я навіть намагався дозволити все в robots.txt, але завжди маю однаковий результат.
Я також уважно переглядав налаштування CloudFront в Amazon і не бачу нічого, що може бути пов’язане (я не використовую та ніколи не використовував параметр: "Обмежити доступ до перегляду (використовувати підписані URL-адреси або підписані файли cookie)".
Зараз я витратив багато часу на це і не маю більше ідей.
Може хтось може придумати причину, чому Googlebot буде заблокований від сканування файлів, розміщених в Amazon CloudFront?
*
в кінці URL-адреси "префікс". /test*
те саме, що /test
.