Стандартне відношення файлів cookie до "відвідувачів"?


31

Як зазначається в недавньому дописі в блозі , ми бачимо велику невідповідність між "відвідувачами" Google Analytics та "відвідувачами" Quantcast.

Крім того, з причин, про які ми ніколи не з'ясували, Google Analytics отримує більшу кількість, ніж Quantcast. Зараз GA показує більше відвідувачів (15 мільйонів) лише на сайті stackoverflow.com, ніж Quantcast бачить у всій мережі (14 мільйонів):

Чому? Не знаю. Або Google Analytics іноді втрачає файли cookie, або Quantcast не вистачає відвідувачів. Підрахунок - це неточна наука.

Ми вважаємо, що це тому, що Quantcast використовує більш консервативне співвідношення куки-відвідувачів . Тоді як Google Analytics може вважати кожен cookie "відвідувачем", Quantcast вважатиме кожним 1,24 cookie "відвідувачем". Це має сенс для мене, оскільки люди можуть отримувати доступ до наших сайтів із декількох комп’ютерів, декількох браузерів та інших програм.

У мене є два тісно пов'язані питання:

  1. Чи прийнято стандартне відношення файлів cookie до відвідувачів? Це, очевидно, неточна наука, але чи виникає якесь головне правило?

  2. Чи є більш точний спосіб підрахунку "відвідувачів" веб-сайту, окрім того, як покладатися на файли cookie браузера? Або це завжди буде чимось найкращим прикладом оцінки зусиль, незалежно від того, як ви це вимірюєте?


Quantcast напевно використовує файли cookie, правда? Вони не просто переходять на IP-адресу чи щось таке?
НезадоволенеЗатерев

@disgruntledgoat я щойно перевірив веб-сайт: "Quantcast надає дані про аудиторію як для унікальних лічильників cookie, так і для людей".
Меттью Брукс

@DisgruntledGoat перевірте цю саму сторінку. У ньому є файли cookie від quantserve.com.
Яхель

Відповіді:


14

Quantcast по електронній пошті мені:

Ви згадали, що між вашими номерами GA та вашими QC номерами була досить значна дельта. Хоча це трапляється не часто, але це трапляється, і це є кілька причин. Наприклад, ми враховуємо сторонні файли cookie та автоматичне оновлення, а GA - ні. Ми також просимо видавців розмістити наш тег внизу сторінки, щоб відповідати стандартам MRC та IAB. Якщо ваші інші мірки вимірювання вище на сторінці, вони можуть запускатись, коли Quantcast не робить. (Ми є єдиною службою вимірювання трафіку, яка акредитована MRC). Крім того, цифри ніколи не будуть абсолютно однаковими через міркування часового поясу - ми використовуємо функцію нормалізації і GA виправлено.

Якщо ви хочете дізнатися більше про те, як ми визначаємо наші номери, перегляньте: http://www.quantcast.com/how-we-do-it . Ми також маємо довідки про наші дані про аудиторію, виправлену файлами cookie, та нашу методологію, розміщену тут.

Переглядаючи білі газети, я бачу, що вони насправді роблять те, що пропонує Джефф: підробляти «офіційні» номери, щоб отримати щось, що, на їхню думку, ближче до справжньої кількості людей. У них є Біла книга з виправленою аудиторією з файлами cookie (посилання PDF), що означає, що їх система досить досконала, не така проста, як просто ділення на магічне число:

Програма Quantcast Quentified Publisher щомісяця фіксує понад 75 мільярдів подій щодо споживання ЗМІ, що генерується понад 1,4 мільярда файлів cookie (дані станом на червень 2008 року). Більше того, багато наших кількісно визначених партнерів видавця діляться з нами анонімними ідентифікаторами, незалежними від файлів cookie. Наша модель також включає декілька панелей, які передбачають орієнтири та калібрування, засновані на людях, без видалення файлів cookie. Ми триангулюємо цю масу даних різними процесами збору, упередженнями та проблемами. Наші моделі враховують частоту відвідування, часові періоди, ймовірність багаторазового використання комп’ютера та навіть вплив декількох людей, які використовують один і той же комп'ютер, щоб оцінювати людей на основі оцінок. Наша модель для перекладу унікальних файлів cookie на людей була підтверджена за допомогою пробних зразків та незалежних наборів даних. Крім того, наша модель є динамічною та відкаліброваною на постійній основі, щоб відображати еволюцію закономірностей Інтернет-трафіку.


2
Цікаво. Останній уривок більш інформативний (і переконливий), ніж перший. GA не потрібно обліковувати сторонні файли cookie, оскільки він використовує файли cookie. Так, різниці в часових поясах змінять точні цифри, але тривалість місяця вкрай малоймовірна для врахування значних відмінностей у вимірюванні.
Яхель

27

Є ще один фактор, що грає в недооцінці Quantcast: вони використовують сторонні файли cookie (файли cookie, що подаються з .quantserve.comдомену), тоді як Google Analytics використовує сторонні файли cookie ( stackexchange.comтощо)

Це досить важливо, оскільки деякі веб-переглядачі (зокрема Safari, але останнім часом Firefox та Chrome) відключають сторонні файли cookie як налаштування за замовчуванням, а багато інших можуть індивідуально вибирати налаштування конфіденційності, які забороняють сторонні файли cookie. Це означає, що існує певна група населення, яка ніколи не буде відслідковуватися файлами cookie QuantCast. По суті, це означає, що Google Analytics завжди поверне більший кількість відвідувачів.

Я б сказав, що немає принципового правила. Як практикуючий аналітик, я б сказав, що пошуки "справжнього" числа відвідувачів безнадійні, і натомість зосереджуюсь на самих візитах. Наприклад, до вашого облікового запису Google Analytics я принаймні 8 різних відвідувачів, які отримали доступ до StackOverflow із Chrome, Safari та Firefox на своєму робочому ноутбуці, особистому ноутбуці, телефоні та iPad. Усі служби Analytics підраховують по-різному, і, таким чином, всі повертають значно різні числа.

Навіть з ідеальною реалізацією Google Analytics майже завжди показуватиме менший показник відвідувань, ніж система аналітики на основі сервера, але покаже більший кількість відвідувань, ніж система сторонніх файлів cookie, як Quantcast. Важливо не дивитися на підсумкові підсумки, а на тенденції, які кожен метод демонструє в своїх силах. Отже, ніколи не порівнюйте номери Quantcast з номерами Google Analytics; натомість використовуйте числа в контекстах, в яких вони були зібрані.

Інша проблема може полягати в тому, що ваша реалізація Google Analytics невірна, оскільки налаштування її для вашого типу налаштування для кількох доменів і субдоменів може бути кошмаром, якщо не виконано правильно та суворо, що може призвести до того, що один браузер зараховується як кілька відвідувачів, що само поповнює ваш рахунок. Це ніколи не є проблемою для Quantcast, оскільки всі файли cookie встановлені в домені сторонньої сторони.


Google Chrome також, здається, за замовчуванням блокує сторонні файли cookie.
MrWhite

7

Співвідношення файлів cookie до унікальних відвідувачів зазвичай становить від 1,3 до 1,7 для сайтів, які відвідують понад мільйон відвідувань.

Хоча yc01 вірно, що GA використовує файли cookie від сторонніх виробників порівняно із сторонніми файлами cookie, ми на RealSelf.com використовуємо двох постачальників аналітики (GA та Comscore Direct), а GA все ще показує на 30% більше абсолютних відвідувачів, ніж унікальних відвідувачів Comscore.

Comscore показує лише унікальних відвідувачів за країнами, тому для порівняння GA з Comscore нам слід обчислити кількість абсолютних унікальних відвідувачів, заснованих у США, таким чином:

Відвідування США / Глобальні візити * Абсолютні унікальні користувачі

(1,150,110 / 1,650,979) * 1,273,059 = 886,842 Унікальні користувачі США

На відміну від цього, Comscore повідомляє про 680 900 унікальних користувачів із США. Так GA показує на 30,2% більше.

Comscore побудував свій бізнес, намагаючись бути точним, тоді як GA - це насамперед безкоштовний спосіб відстеження та оптимізації сайтів, які використовують AdWords та AdSense. У Comscore є група людей, яку вони також використовують для оцінки трафіку, і вони використовують цю панель для визначення середньої кількості файлів cookie на людину. Оскільки більше людей використовують мобільні пристрої (використання мобільних пристроїв становить 15%), є сенс, що унікальні файли cookie завищують кількість унікальних людей.


"Співвідношення файлів cookie до унікальних відвідувачів зазвичай становить від 1,3 до 1,7 для сайтів, які відвідують понад мільйон." Це цифра, опублікована Comscore?
Ciaran

це напрочуд точно для нас; Я провів UserSessionстатистику таблиці на кількох сайтах, і вони варіюються від 2,0 (переповнення стека) до 1,46 (webapps.se) з усім іншим між ними. 1.6 видається дуже розумним за замовчуванням для сайтів, орієнтованих на технологію.
Джефф Етвуд

4

Ось нещодавнє (4 травня 2011 р. - вчора, коли я це пишу) дослідження від MediaMind із "множниками інфляції файлів cookie" для різних ринків:

Їх розрахунковий коефіцієнт інфляції становить від 2,2 до Німеччини до 3,0 для США.


це чудово - саме таку інформацію, яку я шукав,
Джефф Етвуд

2

Може бути, ваш номер відвідувачів GA завищений, ніж звичайний сайт, через більш технічний характер аудиторії? Наприклад, програмісти, особливо веб-розробники, частіше використовують різні браузери і тим самим збільшують кількість файлів cookie.

Для питання 1 я здогадуюсь, що, як і для багатьох показників, краще використовувати дані з вашого власного сайту, а не шукати глобальні стандарти, оскільки агрегати можуть вводити в оману. Одним із способів отримати файл cookie до реального кількості відвідувачів може бути підрахувати, скільки файлів cookie ви бачите від кожного зареєстрованого користувача, а потім отримати число від цього.

Що стосується числа 2, то теоретично найкращим способом підрахунку реальних відвідувачів було б змусити всіх зареєструвати акаунт. Оскільки це, очевидно, не дуже гарна ідея, тоді можна поглянути на нормалізацію. Наприклад, ви можете використовувати середні файли cookie для зареєстрованих показників користувачів, які я запропонував вище, і застосувати його до номерів відвідувачів, про які повідомляє GA.


це ВЕЛИКИЙ пункт. На потоці переповнення стека в даний час ми маємо 531 484 сеанси, з яких 261 557 вказують на унікальних користувачів - так це в основному 2 файли cookie на кожного 1 користувача.
Джефф Етвуд

-1

Я думаю, що IP здатний довіряти ... коли я створюю статистичну систему на зразок GA з python, я використовую такий метод, як цей

  • відправити cookie в браузер і захопити всі дані агента до бази даних
  • простий спосіб, якщо новий візит має файли cookie, це не новий візит, тому я зберігаю його як не новий візит (також я призначив дату та час затримки для пошуку нового візиту, якщо користувач повторить сайт відвідування через 2 години)
  • збережіть IP-адресу користувача та деякий ідентифікатор для цього користувача, а також IP та cookie (його збереження також у файлі cookie)
  • приходить новий користувач і не має жодного файлу cookie ... це IP новий? так? ОК, його новий користувач лише захоплює агент користувача та IP / ні? скільки разів приходить цей користувач? більше, ніж ліміт? насправді не новий візит, не більше цього агента користувача? Добре це нове ...: D

у цього методу є несправність, але непогано, і майже дійсні дані ... (це також залежить від часу затримки, щоб знайти нового користувача (затримка між двома відвідуваннями) та часу випробування, щоб користувачі не cookie)


5
Як би це обробити, наприклад, компанія з багатьма різними розробниками, які звертаються до StackOverflow з-за NAT? Чи всі вони будуть зараховані до одного відвідувача?
Свиш

3
IP-аспект цього дійсно хибний. IP-адреса не є унікальним ідентифікатором.
Яхель

є час для цього спробувати ... ми перевіряємо агента та інші речі, і ми можемо додати один ip більше 100 разів ... запропонований спосіб знайти реального користувача позаду NAT
Mohammad Efazati
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.