Вам потрібна модель вірогідності.
Ідея системи ранжування полягає в тому, що одне число адекватно характеризує здібності гравця. Ми можемо назвати це число їх "силою" (тому що "ранг" вже означає щось конкретне в статистиці). Ми б прогнозували, що гравець A переможе гравця B, коли сила (A) перевищить силу (B). Але це твердження занадто слабке, оскільки (а) воно не є кількісним і (б) воно не враховує можливості слабшого гравця, який періодично б'є сильнішого гравця. Ми можемо подолати обидві проблеми, припустивши, що ймовірність того, що A б'є B, залежить лише від різниці в їх сильних сторонах. Якщо це так, то ми можемо повторно виразити всі сильні сторони, необхідні, щоб різниця в сильних сторонах дорівнювала шансам на виграш.
Конкретно ця модель є
l o g i t (Pr(A б'є B))= λА- λБ
де, за визначенням, - коефіцієнт журналу, і я написав для сили гравця A тощо.l o g i t (p)=журнал( p ) - журнал( 1 - р )λА
Ця модель має стільки ж параметрів, скільки гравців (але є одна менша ступінь свободи, оскільки вона може визначати лише відносні сильні сторони, тому ми б фіксували один з параметрів довільним значенням). Це своєрідна узагальнена лінійна модель (у сімействі Біноміальних, з logit-посиланням).
Параметри можна оцінити за максимальною вірогідністю . Ця ж теорія забезпечує засоби для встановлення довірчих інтервалів навколо оцінок параметрів та перевірки гіпотез (наприклад, чи є найсильніший гравець, згідно з оцінками, значно сильніший, ніж передбачуваний слабкий гравець).
Зокрема, ймовірність набору ігор є продуктом
∏всі ігридосвід( λпереможець- λневдаха)1 + експ( λпереможець- λневдаха).
Після фіксації значення однієї з , оцінки інших - це значення, які максимально збільшують цю ймовірність. Таким чином, варіювання будь-якої з оцінок знижує ймовірність від її максимуму. Якщо вона зменшена занадто сильно, це не відповідає даним. Таким чином ми можемо знайти довірчі інтервали для всіх параметрів: вони є межами, в яких зміна оцінок не надто зменшує ймовірність журналу. Загальні гіпотези можна аналогічно перевірити: гіпотеза обмежує сильні сторони (наприклад, якщо припустити, що вони всі рівні), це обмеження обмежує, наскільки велика ймовірність може отримати, і якщо цей обмежений максимум занадто далеко не перевищує фактичного максимуму, гіпотеза відхилено.λ
У цій конкретній проблемі є 18 ігор та 7 безкоштовних параметрів. Загалом, це занадто багато параметрів: є стільки гнучкості, що параметри можна досить вільно змінювати, не змінюючи максимальної ймовірності сильно. Таким чином, застосування механізму ML може виявити очевидне, а це те, що, ймовірно, недостатньо даних для впевненості в оцінках міцності.