Загальний рейтинг з кількох рейтингових списків

13

Я переглянув багато літератури, доступної в Інтернеті, включаючи цей форум без жодної удачі і сподіваючись, що хтось може допомогти статистичній проблемі, з якою я зараз стикаюся:

У мене є 5 списків рейтингових даних, кожен з яких містить 10 предметів, класифікованих від позиції 1 (найкраща) до позиції 10 (найгірша). Задля контексту, 10 пунктів у кожному списку однакові, але в різних рангованих порядках, оскільки методика, що використовується для визначення їх рангу, різна.

Приклад даних:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

Я шукаю спосіб інтерпретувати та аналізувати вищезазначені дані, щоб отримати кінцевий результат, що показує загальний ранг кожного елемента на основі кожного тесту та його позиції, наприклад

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

Поки я намагався інтерпретувати цю інформацію, виконуючи тести на кореляцію Пірсона, Кореляцію Спірмена, Кендалл Тау на В і Фрідмана. Однак я виявив, що ці результати, як правило, спаровують мої списки (тобто порівнюють список 1 до списку 2, потім список 1 до списку 3 .. і т. Д.), Або дають такі результати, як Chi-Square, P-Values і т.д. щодо загальної дані.

Хтось знає, як я можу інтерпретувати ці дані статистично обгрунтованим методом (на застосованому рівні після аспіранта / доктора наук), щоб я міг зрозуміти загальні ранги, що сигналізують про важливість кожного елемента в списку протягом 5 тестів? Або, якщо є інший тип техніки чи статистичного тесту, я можу розглянути, я буду вдячний за будь-які підказки чи поради.

(Це, можливо, також варто відзначити, я також виконував більш прості математичні прийоми, такі як сума, усереднення, мінімально - максимальні тести і т. Д., Але не вважаю, що це досить важливо на цьому рівні).

Будь-яка допомога чи порада буде дуже вдячна, дякую за ваш час.

statistical-significance ranking valuation

— Ліам
джерело

1

Я знаходжу два питання, які, відповідно трактовані, здаються дублікатами (і тому вже дають відповіді): stats.stackexchange.com/search?q=valuation+rank . Ці адекватні? Якщо ні, будь ласка, допоможіть нам зрозуміти, що є особливим у вашій ситуації.

— whuber

Дякую за Вашу відповідь. Я ознайомився з цими статтями, і я не впевнений, чи вони не те, що я шукаю, чи винне це моє розуміння. У цих статтях я створюю враження, що кожен із наборів даних має багато змінних різних значень, і що ранги можуть бути різними або мати більше детальних цілих значень, ніж просто ранг. Я просто шукаю статистично перевірений спосіб, щоб можна було сказати "загалом найважливіший пункт - це пункт X, а потім Y ... і нарешті (або найменш важливий) пункт Z". Я майже розглядаю аналіз цих рангів 1-10 як прості цифри

— Ліам

1

Одним із головних моментів цих тем є те, що не існує жодного такого "статистично перевіреного способу". Це питання оцінки : будь-яка статистична комбінація ваших результатів відображає відчуття компромісів серед них. Наприклад , вашими "об'єктами" можуть бути автомобілі, а "техніка" може класифікувати їх за різними ознаками: вартість, економічність палива, потужність, комфорт тощо. Ваше особисте відчуття "найкращого" може істотно відрізнятися від чужого сенсу і ви обоє мали б рацію.

— whuber

ви отримали відповідь? залиште коментар тут stats.stackexchange.com/questions/347336/…

— Рей Кодер

7

Я не впевнений, чому ви дивилися на співвідношення та подібні заходи. Здається, немає нічого співвідносного.

Натомість існує цілий ряд варіантів, жоден із насправді не кращий за інші, але залежно від того, що ви хочете:

Візьміть середню оцінку та оцініть середні значення (але це трактує дані як інтервал)

Візьміть медіанний ранг та оцініть медіанів (але це може призвести до зв’язків)

Візьміть кількість голосів 1-го місця, отриманих кожним предметом, і класифікуйте їх, виходячи з цього

Візьміть кількість голосів на останньому місці та оцініть їх (навпаки, очевидно) виходячи з цього.

Створіть деяку зважену комбінацію рангів, залежно від того, що ви вважаєте розумним.

— Пітер Флом - Відновити Моніку
джерело

4

Важливим моментом у темах, на які я посилався у коментарі - і я думаю, що це суть всього питання - є те, що всі ці методи є довільними . Існують об'єктивні методи, але вони вимагають використання інформації, не притаманної даним. Саме це робить проблему оцінювання, а не статистику.

— whuber

Яке зважене поєднання рангів ви б запропонували?

— Арчі

4

Як зазначали інші, існує маса варіантів, які ви можете використати. Метод, який я рекомендую, базується на середніх чинах, тобто першій пропозиції Петра.

У цьому випадку статистичну значимість підсумкового рейтингу можна вивчити двоступеневим статистичним тестом. Це непараметрична процедура, що складається з тесту Фрідмана з відповідним пост- хоковим тестом, тестом Неменії . Обидва вони базуються на середніх званнях. Мета Фрідмана тесту відхилити нульову гіпотезу і укласти , що є деякі відмінності між елементами. Якщо це так, ми переходимо до тесту Неменого, щоб з’ясувати, які предмети насправді відрізняються. (Ми не починаємо безпосередньо тест після спеціальних дій, щоб уникнути значущості, виявленої випадково.)

Більше деталей, таких як критичні значення для цих обох тестів, можна знайти у статті Демсара .

— Вейвей
джерело

2

Використовуйте Tau-x (де "x" відноситься до "eXtended" Tau-b). Tau-x - кореляційний еквівалент метрики відстані Кемені-Снелл - доведеною є унікальною метрикою відстані між списками позицій, що класифікуються, що задовольняє всім вимогам метрики відстані. Дивіться розділ 2 "Математичні моделі в соціальних науках" Кемені та Снелла, також "Коефіцієнт кореляції нового рангу із застосуванням до проблеми ранжирування консенсусу", Едвард Емонд, Девід Мейсон, Журнал аналізу багатокритерійних рішень, 11: 17- 28 (2002).

— Стівен
джерело