Заздалегідь дякую за те, що зі мною я не є статистикою, і не знаю, як описати те, що я собі уявляю, тому Google мені тут не допомагає ...
Я включаю систему оцінювання у веб-програму, над якою працюю. Кожен користувач може оцінювати кожен елемент рівно один раз.
Я уявляв шкалу з 4 значеннями: "сильно не подобається", "не подобається", "подобається" і "сильно подобається", і я планував присвоїти ці значення відповідно -5, -2, +2 і +5 відповідно .
Тепер, якщо кожен предмет матиме однакову кількість оцінок, то мені було б цілком комфортно з цією системою балів, як чітко розмежувати найбільш вподобані та найменш сподобалися елементи. Однак пункти не матимуть однакової кількості оцінок, а розбіжність між кількістю голосів на різних фотографіях може бути досить драматичним.
У такому випадку порівняння сукупних балів за двома пунктами означає, що старий предмет з безліччю посередніх оцінок матиме набагато вищу оцінку, ніж винятковий новий предмет із значно меншою кількістю голосів.
Отже, перше очевидне, що я думав про нас - середній показник ... але тепер, якщо елемент має лише один рейтинг "+5", він має кращий середній показник, ніж предмет, який має оцінку 99 "+5". та 1 "+2" рейтинг. Інтуїтивно це не є точним відображенням популярності товару.
Я думаю, що ця проблема є загальною, і ви, хлопці, не потребую, щоб я вважав це більше прикладами, тому я зупинюсь на цьому і детально пишу в коментарях, якщо потрібно.
Мої запитання:
- Як називається така проблема, і чи існує термін для методик, які використовуються для її вирішення? Я хотів би це знати, щоб я міг прочитати на ньому.
- Якщо вам трапляється знати про будь-які сприятливі для цього ресурси ресурси, я дуже вдячний за посилання.
- Нарешті, я вдячний за будь-які інші пропозиції щодо ефективного збору та аналізу такого роду даних.