Величезний приплив прямого руху з одного конкретного міста


9

Минулого місяця я помітив, що прямі відвідування нашого сайту зросли майже на 150%, в той час як показник відмов також значно підвищився.

Після подальшого висвітлення я можу побачити, що в нас було майже 2000 прямих відвідувань одного міста в Коннектикуті під назвою Стемфорд зі ступенем відмов 100%!

Я чухав відповіді, але можу лише встановити, що це може бути пов'язано з нашим інструментом моніторингу часу; Пінгдом.

Хтось знає / має досвід із подібним питанням, будь-яка допомога вдячна

  • Я щойно помітив, що ми отримуємо однаковий трафік у місті в Англії та містечку в Шотландії ... Це, безумовно, змушує мене думати, що це стосується нашого інструменту моніторингу часу.

Хтось, можливо, зробив закладки будь-яких ваших статей у соціальних мережах, що дають короткотерміновий трафік
AgA

Сумніваюсь, у нас було майже 2000 відвідувань із Стамфорда, Едінбурга та Саутенда на морі, які мають 100% відмов. Також відвідування на нашій домашній сторінці, на відміну від будь-яких статей / відповідей у ​​блозі, які можуть вимагати відмови.
Подвійний клацання

Чи можете ви бути готові розкрити назву веб-сайту? Я маю ідею, але мені потрібно знати цю інформацію. Просто ім'я домену, навіть не ccTLD, якщо ви хочете сказати не так.
Еллі Кессельман

Привіт, ось трохи посилання на мій веб-сайт (не хочу вставляти домен з причин пошуку!) Bit.ly/WIHw2G
Подвійний

Джек Я опублікував відповідь із посиланням на сайт, де обговорювали фільтрацію ботів.
Анагіо

Відповіді:


11

Визначення причини дивних локалізованих стрибків трафіку, які, здається, не є відвідувачами людини, вимагає терпіння та детективної роботи, але основними кроками є:

  1. Дізнайтеся, звідки це відбувається, використовуючи доступні вам інструменти (див. Нижче).

  2. Визначте, небезпечно це чи ні, проаналізувавши джерела запиту, частоту, самі заголовки запиту та вплив на вашу мережу та сервер (и).

  3. Вирішіть, чи потрібно блокувати його лише в Google Analytics, щоб запобігти його появі у вашій статистиці (використовуючи фільтр Google Analytics), а також заблокувати його на сервері, щоб у майбутньому не потрапляти на ваш сайт (використовуючи брандмауер або послугу, наприклад Cloudflare ) або взагалі ігнорувати його.

Я не буду деталізувати наслідки для безпеки, тому що ви, здається, більше стурбовані впливом, який він надає на ваші аналітичні дані. Ось деякі спостереження щодо цього конкретного випадку, за допомогою деяких покажчиків, щоб визначити можливе джерело та відфільтрувати небажаний трафік у Google Analytics:

Мабуть, це не Pingdom

Колеси Google Analytics навряд чи будуть відвідувати Pingdom з двох причин:

  • HTTP-перевірки Pingdom не розбирають JavaScript , тому вони не запускають вбудовані сценарії Google Analytics. (Я вчора двічі перевірив це з командою підтримки Pingdom, тому що я також використовую Pingdom і мені було цікаво. Ось пряма цитата з їх електронного листа підтримки: "Оскільки наш HTTP-чек не виконує жодного коду JavaScript, Google Analytics не матиме жодного записи про наші візити, здійснені нашими веб-серверами зондів. " )

  • Наразі Pingdom не має серверів у Единбурзі. Вони перелічують усі свої сервери Probe з адресою IP та місцезнаходженням на сторінці на панелі керування (посилання під назвою "Пробні сервери" в нижньому правому куті всіх адміністративних сторінок Pingdom при вході в систему). Єдині два, перелічені у Великобританії зараз, - у Манчестері та Лондоні.

Але не потрібно приймати моє слово за це. Якщо шипи тривають і ви хочете підтвердити, що Pingdom не є причиною раптових візитів та стрибків відмов, ви можете:

  1. Призупиніть запити на Pingdom на свій сайт і подивіться, чи не зникнуть звернення з цих областей. (Я підозрюю, що це не зміниться.)

    - або -

  2. Налаштуйте сторінку на example.com/pingdom/any-url-you-like, наведіть ваші запити на Pingdom на цю сторінку замість домашньої сторінки та виключіть /pingdom/підкаталог з результатів Google Analytics шляхом (a) видалення коду відстеження Analytics на цій сторінці або (b) використанням фільтра для виключення сторінки в Google Analytics, якщо ви не можете видалити код відстеження на кожній сторінці (наприклад, якщо ви використовуєте CMS, що включає код на кожній сторінці, і у вас немає достатнього доступу для зміни цієї поведінки).

Як фільтрувати запити за допомогою Google Analytics

Це необхідно тільки , якщо ви підозрюєте , що Pingdom робить синтаксичний аналіз JavaScript, і немає ніяких ознак того, що він робить, але фільтрувати візити Pingdom , як це один з способів перевірити , якщо ви хочете , щоб заспокоїти себе. Також корисно дізнатися, як це зробити, щоб ви могли відфільтрувати інші типи відвідувань у майбутньому, якщо вам потрібно:

  1. Увійдіть у Google Analytics і натисніть посилання "Адміністратор" (угорі праворуч, поруч із "Довідкою")

  2. Клацніть доменне ім’я або ім’я сайту для профілю, який ви хочете відфільтрувати. (наприклад example.com)

  3. Перейдіть на вкладку «фільтри».

  4. Натисніть "+ Новий фільтр".

  5. Дайте ім’я фільтру та залиште "Попередньо визначений фільтр" вибраним.

  6. У спадному вікні виберіть "Виключити ... трафік до підкаталогів ..., рівних".

  7. Введіть /pingdom/у поле Підкаталог та залиште "Чутливий до регістру" встановлений на "Ні".

Це повинен бути результат, коли ви закінчите:

Фільтрування Pingdom в Google Analytics

Збережіть ці налаштування, потім перенаправіть свої чеки на Pingdom example.com/pingdom/any-page-or-url-that-exists, і Google Analytics тепер фільтрує відвідування цієї URL-адреси. (Ви все одно отримаєте базові звіти про оновлення часу на сервері таким чином, навіть якщо Pingdom більше не вказує на вашу домашню сторінку.)

Якщо це не Pingdom, звідки беруться ці хіти?

Можна спробувати дізнатися кількома способами:

1. Подивіться, яка мережа надсилає вам найбільше відскочив трафік. Для цього в Google Analytics перегляньте розділ "Стандартна звітність" для свого сайту, а потім виберіть "Аудиторія> Технологія"> "Мережа" з лівого боку. Нарешті, вибираючи режим пиріжкової діаграми (за замовчуванням), виберіть зі спадного меню праворуч пункт "Внесок у загальний ... Відмов":

Всього відмов

Ви побачите список провайдерів або мережевих постачальників, користувачі яких внесли свій внесок у показник відмов. Іноді це буде невеликий, специфічний Інтернет-провайдер, який ви можете простежити до однієї області чи бізнесу. Озброївшись назвою постачальника мережі, що надсилає вам підстрибуючий трафік, ви можете відфільтрувати цю конкретну мережу з Google Analytics, як описано вище, але фільтруючи мережу замість субдомену.

В іншому випадку топ-провайдером, що перераховується, буде великий вітчизняний провайдер, який може мати мільйони клієнтів, і ви не будете мудрішими. З цього моменту Google Analytics не може допомогти вам визначити, хто з клієнтів цього постачальника надсилає неодноразовий відхилений трафік (оскільки Analytics більше не містить інформацію про IP-адресу чи інші ідентифікаційні дані). Щоб отримати такий тип даних, ви можете або скористатися іншим постачальником даних статистики, який робить протокол IP-адрес (наприклад, Clicky ), або ви можете проаналізувати журнали ваших серверів, які також записують доступ за IP-адресою:

2. Вивчіть журнали доступу до веб-сервера, щоб вивчити відвідування відомих сканерів та шукати повторний доступ з тієї самої IP-адреси. У цьому вам може допомогти веб-інструмент статистики, такий як AWStats. Він досить популярний серед певних хостів, і вони, можливо, вже встановили його для вас.

Ось деякий зразок виходу з AWStats . Два релевантні для вас секції - "Господарі" та "Роботи / відвідувачі павуків".

У розділі "Хости" можуть бути підказки щодо того, які IP-адреси отримували доступ до сайту, щоб викликати відмови (а потім ви можете відфільтрувати ці IP адреси в Google Analytics). Розділ роботів / павуків може давати підказки про будь-які сканери або автоматизовані скрипти, які переходять на ваш сайт, які можуть використовувати JavaScript. Якщо ви не впевнені, як читати або отримувати доступ до журналів сервера, зверніться за допомогою до свого постачальника хостингу.

Отримали IP-адресу? Дізнайтеся, хто ним користується.

Якщо вам вдасться отримати IP-адресу з розділу Hosts в AWStats або в іншому місці, ви можете зробити зворотний пошук IP, щоб визначити, хто може ним користуватися.

Зворотний пошук IP часто дасть вам ім'я постачальника хостингу, до якого ви могли б повідомити про зловживання, якщо ви вважаєте, що запити шкідливі. Або він може дати вам ім'я домашнього провайдера, який користується клієнтом, використовуючи сценарій автоматизації для спроби використання вашого веб-сайту. Зазвичай ви можете надсилати повідомлення про зловживання на те abuse@example.com, де example.comназва хостинг-провайдера або провайдера. І, іноді, він запропонує назву конкретної компанії, до якої ви можете зв’язатися для отримання додаткової інформації.


Деякі служби Pingdom DO зараз виконують JavaScript. Перегляньте їхній довідковий веб-сайт, щоб отримати докладніші відомості та робочі місця: help.pingdom.com/hc/en-us/articles/…
Джастін

1

Чи це Pingdom, чи ні, залежить від того, які параметри ви встановили для послуги pingdom.

Якщо воно встановлено для запиту http, то так, це, ймовірно, Pingdom. Якщо він не використовує http-запити (лише ping або інші сервіси), це не буде Pingdom, але я вважаю, що ви використовуєте http-запити.

Я не використовую pingdom, тому не знаю, чи маєте ви контроль над частотою їх тестів. Якщо ви можете тоді чудово. Якщо ні, ви можете перейти лише до використання тестів ping, але це не гарантує, що веб-сайт працює - лише сервер працює.

Якщо ви не можете зменшити частоту тестів на pingdom, а кількість трафіку, який він генерує, є проблематичним, тоді вам доведеться просто його скинути. Однак 2000 запитів на місяць, мабуть, не буде великою проблемою - вони просто по-справжньому зіпсують аналітичну інформацію вашого веб-сайту.

Ви можете спробувати обійти цю проблему, виділивши запити Pingdom і шукаючи шаблон. Потім, якщо у вас є власні аналітичні сценарії, ви можете виявити шаблон і видалити IP-адреси, які відповідають шаблону, з ваших результатів аналізу. Однак ви можете вирішити, що це не варто клопоту і просто пам’ятайте про кількість помилкових звернень, що створюються Pingdom щомісяця.

Я сподіваюся, що це допомагає.


Дякую, я говорив з Pingdom, і вони вважають, що це не має нічого спільного з ними. У мене є ще один біт програмного забезпечення для відстеження, який називається Leadforensics, який розробляє назву компанії на основі IP, і, здається, думаю, що це компанія під назвою NCC Group ( nccgroup.com ). Зараз я обговорюю це з їх технічними підрозділами.
Подвійний клацання

1

Тут є добра стаття про те, як визначити та відфільтрувати трафік бота на ваш веб-сайт Pingdom, включена ось стаття http://www.blastam.com/blog/index.php/2012/06/block-web-monitoring-bots-in -google-analytics / занадто довго, щоб копіювати тут

Чи знаєте ви, що якщо ви використовуєте таку послугу, як Keynote, для контролю ефективності свого веб-сайту, це впливає на ваші веб-показники? Такі сервіси, як Keynote, Gomez, AlertSite, Pingdom та багато інших, використовують справжній веб-браузер, щоб відвідувати ваш сайт неодноразово протягом дня, щоб оцінити ефективність завантаження. Вони завантажують ваш сайт з різних локацій по всьому світу за допомогою реальних браузерів, які виконують JavaScript відстеження Google Analytics.


1

Це, мабуть, довіра до сайту aka aka NCC Group.

Для нашого сайту трохи розслідування з фільтрами GA виявило всі таємничі хіти Едінбурга та Стемфорда з ПК із Windows 7, IE8, але з роздільною здатністю 800x600, що виглядало дещо риба.

Ми перевіряли наші журнали на предмет будь-яких звернень із IE 8 і швидко знаходили схему звернень кожні 5 хвилин; Зворотний DNS для цих IP-адрес, і вони від сайту Confidence - це має багато сенсу, оскільки ми попросили їх це зробити.


-2

Це, мабуть, само собою зрозуміло, але це ТІЛЬКО, ймовірно, це невиявлена ​​автоматизована діяльність. Будь-яка діяльність, яка сильно перекриває (100% відмов), цілком ймовірно, є поведінкою бота, яка якось потрапила через фільтри ботів GA.

Якщо ви можете, розріжте ці відвідування за допомогою браузера / агента; якщо вони всі є одним агентом (що я б здогадався), це посилить шанси на автоматизовану діяльність.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.