Визначення причини дивних локалізованих стрибків трафіку, які, здається, не є відвідувачами людини, вимагає терпіння та детективної роботи, але основними кроками є:
Дізнайтеся, звідки це відбувається, використовуючи доступні вам інструменти (див. Нижче).
Визначте, небезпечно це чи ні, проаналізувавши джерела запиту, частоту, самі заголовки запиту та вплив на вашу мережу та сервер (и).
Вирішіть, чи потрібно блокувати його лише в Google Analytics, щоб запобігти його появі у вашій статистиці (використовуючи фільтр Google Analytics), а також заблокувати його на сервері, щоб у майбутньому не потрапляти на ваш сайт (використовуючи брандмауер або послугу, наприклад Cloudflare ) або взагалі ігнорувати його.
Я не буду деталізувати наслідки для безпеки, тому що ви, здається, більше стурбовані впливом, який він надає на ваші аналітичні дані. Ось деякі спостереження щодо цього конкретного випадку, за допомогою деяких покажчиків, щоб визначити можливе джерело та відфільтрувати небажаний трафік у Google Analytics:
Мабуть, це не Pingdom
Колеси Google Analytics навряд чи будуть відвідувати Pingdom з двох причин:
HTTP-перевірки Pingdom не розбирають JavaScript , тому вони не запускають вбудовані сценарії Google Analytics. (Я вчора двічі перевірив це з командою підтримки Pingdom, тому що я також використовую Pingdom і мені було цікаво. Ось пряма цитата з їх електронного листа підтримки: "Оскільки наш HTTP-чек не виконує жодного коду JavaScript, Google Analytics не матиме жодного записи про наші візити, здійснені нашими веб-серверами зондів. " )
Наразі Pingdom не має серверів у Единбурзі. Вони перелічують усі свої сервери Probe з адресою IP та місцезнаходженням на сторінці на панелі керування (посилання під назвою "Пробні сервери" в нижньому правому куті всіх адміністративних сторінок Pingdom при вході в систему). Єдині два, перелічені у Великобританії зараз, - у Манчестері та Лондоні.
Але не потрібно приймати моє слово за це. Якщо шипи тривають і ви хочете підтвердити, що Pingdom не є причиною раптових візитів та стрибків відмов, ви можете:
Призупиніть запити на Pingdom на свій сайт і подивіться, чи не зникнуть звернення з цих областей. (Я підозрюю, що це не зміниться.)
- або -
Налаштуйте сторінку на example.com/pingdom/any-url-you-like
, наведіть ваші запити на Pingdom на цю сторінку замість домашньої сторінки та виключіть /pingdom/
підкаталог з результатів Google Analytics шляхом (a) видалення коду відстеження Analytics на цій сторінці або (b) використанням фільтра для виключення сторінки в Google Analytics, якщо ви не можете видалити код відстеження на кожній сторінці (наприклад, якщо ви використовуєте CMS, що включає код на кожній сторінці, і у вас немає достатнього доступу для зміни цієї поведінки).
Як фільтрувати запити за допомогою Google Analytics
Це необхідно тільки , якщо ви підозрюєте , що Pingdom робить синтаксичний аналіз JavaScript, і немає ніяких ознак того, що він робить, але фільтрувати візити Pingdom , як це один з способів перевірити , якщо ви хочете , щоб заспокоїти себе. Також корисно дізнатися, як це зробити, щоб ви могли відфільтрувати інші типи відвідувань у майбутньому, якщо вам потрібно:
Увійдіть у Google Analytics і натисніть посилання "Адміністратор" (угорі праворуч, поруч із "Довідкою")
Клацніть доменне ім’я або ім’я сайту для профілю, який ви хочете відфільтрувати. (наприклад example.com
)
Перейдіть на вкладку «фільтри».
Натисніть "+ Новий фільтр".
Дайте ім’я фільтру та залиште "Попередньо визначений фільтр" вибраним.
У спадному вікні виберіть "Виключити ... трафік до підкаталогів ..., рівних".
Введіть /pingdom/
у поле Підкаталог та залиште "Чутливий до регістру" встановлений на "Ні".
Це повинен бути результат, коли ви закінчите:
Збережіть ці налаштування, потім перенаправіть свої чеки на Pingdom example.com/pingdom/any-page-or-url-that-exists
, і Google Analytics тепер фільтрує відвідування цієї URL-адреси. (Ви все одно отримаєте базові звіти про оновлення часу на сервері таким чином, навіть якщо Pingdom більше не вказує на вашу домашню сторінку.)
Якщо це не Pingdom, звідки беруться ці хіти?
Можна спробувати дізнатися кількома способами:
1. Подивіться, яка мережа надсилає вам найбільше відскочив трафік. Для цього в Google Analytics перегляньте розділ "Стандартна звітність" для свого сайту, а потім виберіть "Аудиторія> Технологія"> "Мережа" з лівого боку. Нарешті, вибираючи режим пиріжкової діаграми (за замовчуванням), виберіть зі спадного меню праворуч пункт "Внесок у загальний ... Відмов":
Ви побачите список провайдерів або мережевих постачальників, користувачі яких внесли свій внесок у показник відмов. Іноді це буде невеликий, специфічний Інтернет-провайдер, який ви можете простежити до однієї області чи бізнесу. Озброївшись назвою постачальника мережі, що надсилає вам підстрибуючий трафік, ви можете відфільтрувати цю конкретну мережу з Google Analytics, як описано вище, але фільтруючи мережу замість субдомену.
В іншому випадку топ-провайдером, що перераховується, буде великий вітчизняний провайдер, який може мати мільйони клієнтів, і ви не будете мудрішими. З цього моменту Google Analytics не може допомогти вам визначити, хто з клієнтів цього постачальника надсилає неодноразовий відхилений трафік (оскільки Analytics більше не містить інформацію про IP-адресу чи інші ідентифікаційні дані). Щоб отримати такий тип даних, ви можете або скористатися іншим постачальником даних статистики, який робить протокол IP-адрес (наприклад, Clicky ), або ви можете проаналізувати журнали ваших серверів, які також записують доступ за IP-адресою:
2. Вивчіть журнали доступу до веб-сервера, щоб вивчити відвідування відомих сканерів та шукати повторний доступ з тієї самої IP-адреси. У цьому вам може допомогти веб-інструмент статистики, такий як AWStats. Він досить популярний серед певних хостів, і вони, можливо, вже встановили його для вас.
Ось деякий зразок виходу з AWStats . Два релевантні для вас секції - "Господарі" та "Роботи / відвідувачі павуків".
У розділі "Хости" можуть бути підказки щодо того, які IP-адреси отримували доступ до сайту, щоб викликати відмови (а потім ви можете відфільтрувати ці IP адреси в Google Analytics). Розділ роботів / павуків може давати підказки про будь-які сканери або автоматизовані скрипти, які переходять на ваш сайт, які можуть використовувати JavaScript. Якщо ви не впевнені, як читати або отримувати доступ до журналів сервера, зверніться за допомогою до свого постачальника хостингу.
Отримали IP-адресу? Дізнайтеся, хто ним користується.
Якщо вам вдасться отримати IP-адресу з розділу Hosts в AWStats або в іншому місці, ви можете зробити зворотний пошук IP, щоб визначити, хто може ним користуватися.
Зворотний пошук IP часто дасть вам ім'я постачальника хостингу, до якого ви могли б повідомити про зловживання, якщо ви вважаєте, що запити шкідливі. Або він може дати вам ім'я домашнього провайдера, який користується клієнтом, використовуючи сценарій автоматизації для спроби використання вашого веб-сайту. Зазвичай ви можете надсилати повідомлення про зловживання на те abuse@example.com
, де example.com
назва хостинг-провайдера або провайдера. І, іноді, він запропонує назву конкретної компанії, до якої ви можете зв’язатися для отримання додаткової інформації.