Переваги використання середнього для узагальнення центральної тенденції 5-бального рейтингу
Як згадував @gung, я думаю, що часто буває дуже вагомих причин вважати середнє значення п'ятибального пункту як індекс центральної тенденції. Я вже виклав ці причини тут .
Перефразовуючи:
- середнє значення легко підрахувати
- Середина інтуїтивно зрозуміла і добре зрозуміла
- Середнє значення - це єдине число
- Інші показники часто дають подібне рангове впорядкування об'єктів
Чому середина корисна для Амазонки
Подумайте про цілі Амазонки в повідомленні про середню. Вони, можливо, мають на меті
- забезпечити інтуїтивну та зрозумілу оцінку предмету
- забезпечити прийняття користувачем рейтингової системи
- переконайтесь, що люди розуміють, що означає рейтинг, щоб вони могли відповідним чином використовувати його для інформування про рішення щодо придбання
Amazon надає якусь округлу середню величину, підрахунок частоти для кожного варіанту рейтингу та розмір вибірки (тобто кількість оцінок). Цієї інформації, мабуть, достатньо, щоб більшість людей оцінили як загальні настрої щодо предмета, так і впевненість у такому рейтингу (тобто, 4,5 з 20 рейтингами є більш імовірними, ніж 4,5 з 2 рейтингами; предмет з 10 5 -зірковий рейтинг, а також одна зіркова оцінка без коментарів все ще може бути хорошою позицією).
Ви навіть можете бачити середину як демократичний варіант. Багато виборів вирішуються, виходячи з того, який кандидат отримує найвищу оцінку за двобальною шкалою. Аналогічно, якщо ви берете аргумент, що кожна людина, яка подає рецензію, отримує голос, то ви можете бачити середнє значення як форму, яка зважує голос кожної людини однаково.
Чи справді проблеми в масштабах використання є проблемою?
Існує широкий спектр рейтингових ухилів, відомих у психологічній літературі (огляд див. Saal et al 1980), такі як зміщення центральної тенденції, зміщення поблажливості, зміщення строгості. Також деякі рейтинги будуть більш довільними, а деякі - більш надійними. Деякі можуть навіть систематично брехати, даючи підроблені позитивні чи підроблені негативні відгуки. Це створить різні форми помилок при спробі обчислити справжню середню оцінку для елемента.
Однак, якби ви взяли випадкову вибірку населення, такі зміщення скасуються, і при достатньому розмірі вибірки рейтингів ви все одно отримаєте справжню середню оцінку.
Звичайно, ви не отримаєте випадкової вибірки на Amazon, і є ризик того, що конкретний набір рейтингів, які ви отримуєте за предмет, систематично упереджується бути більш м'яким або суворим тощо. Зважаючи на це, я думаю, що користувачі Amazon оцінять, що представлені користувачем рейтинги походять із недосконалої вибірки. Я також думаю, що цілком ймовірно, що при розумному розмірі вибірки, що у багатьох випадках більшість відмінностей у відповіді на зміну відповідей почнуть зникати.
Можливі аванси понад середні
Що стосується підвищення точності рейтингу, я не став би оскаржувати загальну концепцію середнього значення, але, швидше за все, думаю, що існують інші способи оцінки реального середнього рейтингу сукупності для предмета (тобто середній рейтинг, який буде отриманий були великим представницьким зразком, який просили оцінити предмет).
- Вагові рейтинги грунтуються на їх надійності
- Використовуйте байєсівську рейтингову систему, яка оцінює середній рейтинг як середньозважену суму середнього рейтингу для всіх позицій та середнього значення для конкретного предмета, і збільшуйте зважування для конкретного предмета у міру збільшення кількості рейтингів
- Налаштуйте інформацію рейтингу, грунтуючись на будь-якій загальній тенденції до рейтингу в різних предметах (наприклад, 5 від того, хто зазвичай дає 3, коштував би більше, ніж той, хто зазвичай дає 4).
Таким чином, якщо точність в рейтингу була основною метою Amazon, я думаю, що слід намагатися збільшити кількість рейтингів за позицію та прийняти деякі з перерахованих вище стратегій. Такі підходи можуть бути особливо актуальними при створенні рейтингу "найкращих". Однак для покірного рейтингу на сторінці цілком можливо, що вибіркове значення краще відповідає цілям простоти та прозорості.
Список літератури
- Saal, FE, Downey, RG & Lahey, MA (1980). Оцінка рейтингів: Оцінка психометричної якості рейтингових даних .. Психологічний вісник, 88, 413.