Нижче пара дуже простих моделей. Вони обидва мають дефіцит хоча б одним способом, але, можливо, вони забезпечать щось на основі. Друга модель насправді не відповідає (цілком) сценарієм роботи ОП (див. Зауваження нижче), але я залишаю її, якщо вона певним чином допомагає.
Модель 1 : Варіант моделі Бредлі – Террі
Припустимо, нас насамперед цікавить передбачити, чи одна команда переможе іншу, грунтуючись на гравцях кожної команди. Ми можемо просто записати, чи команда 1 з гравцями перемагає команду 2 з гравцями за кожну гру, ігноруючи остаточний рахунок. Звичайно, це викидає деяку інформацію, але в багатьох випадках це все ж надає багато інформації.( k , ℓ )(i,j)(k,ℓ)
Тоді модель
logit(P(Team 1 beats Team 2))=αi+αj−αk−αℓ.
Тобто у нас є параметр «спорідненості» для кожного гравця, який впливає на те, наскільки цей гравець покращує шанси на перемогу своєї команди. Визначте "силу" гравця за допомогою . Потім ця модель стверджує, що
P ( Команда 1 перемагає команду 2 ) = s i s jsi=eαi
P(Team 1 beats Team 2)=sisjsisj+sksℓ.
Тут є дуже приємна симетрія в тому, що не має значення, як кодується відповідь, доки вона не відповідає прогнозам. Тобто, у нас також є
l o g i t ( P (Команда 2 б'є команду 1))= αк+ αℓ- αi- αj.
Це може бути легко підходити як логістичний регрес із прогнозами, які є індикаторами (по одному для кожного гравця), які приймають значення якщо гравець є в Команді 1 для відповідної гри, якщо вона в команді 2 та якщо вона не брати участь у цій грі.i - 1 0+ 1i- 10
З цього ми також маємо природний рейтинг для гравців. Чим більше (або ), тим більший гравець покращує шанс своєї команди на перемогу. Отже, ми можемо просто класифікувати гравців відповідно до їх розрахункових коефіцієнтів. (Зверніть увагу, що параметри спорідненості ідентифікуються лише до загального зміщення. Тому типовим є виправлення щоб зробити модель ідентифікованою.)s α 1 = 0αсα1= 0
Модель 2 : Незалежна оцінка
NB : Перечитавши питання ОП, очевидно, що наведені нижче моделі є неадекватними для його налаштування. Зокрема, ОП зацікавлена в грі, яка закінчується після того, як одна чи інша команда набирає певну кількість очок. Наведені нижче моделі більше підходять для ігор, які мають фіксовану тривалість у часі. Можуть бути внесені зміни, щоб вони краще вписувалися в рамки ОП, але для розробки потрібна окрема відповідь.
Тепер ми хочемо відстежувати показники. Припустимо, розумне наближення до того, що кожна команда набирає очки незалежно один від одного, кількість очок, набраних у будь-якому інтервалі, незалежно від будь-якого неперервного інтервалу. Тоді кількість балів, яку набирає кожна команда, можна змоделювати як випадкову змінну Пуассона.
Таким чином, ми можемо встановити Poisson GLM таким чином, що оцінка деякої команди, що складається з гравців і у певній грі, є
j log ( μ ) = γ i + γ jij
журнал( μ ) = γi+ γj
Зауважте, що ця модель ігнорує фактичні поєдинки між командами, зосереджуючись виключно на забиванні.
Це дійсно має цікавий зв'язок з модифікованою моделлю Бредлі-Террі. Визначте та припустимо, що грається гра "раптової смерті", в якій перемагає перша команда, яка забиває. Якщо в команді 1 є гравці а в команді 2 є гравці , то
Таким чином, середня швидкість забивання гравців еквівалентна формулі параметра «сила» моделі 1.σi= еγi( i , j )( k , ℓ )
P (Команда 1 б'є команду 2 у раптовій смерті)= σiσjσiσj+ σкσℓ.
Ми можемо розглянути можливість зробити цю модель більш складною, маючи спорідненість "злочин" та "захист" спорідненість для кожного гравця, таким чином, якщо команда 1 з грає в команду 2 з , тоді
і
ρiδi( i , j ) ( k , ℓ )
журнал( мк1) = ρi+ ρj- δк- δℓ
журнал( мк2) = ρк+ ρℓ- δi- δj
Зарахування балів досі не залежить від цієї моделі, але тепер між гравцями кожної команди існує взаємодія, яка впливає на рахунок. Гравці також можуть бути класифіковані відповідно до їх оцінок коефіцієнта спорідненості.
Модель 2 (та її варіанти) дозволяють передбачити і підсумковий результат.
Розширення : Одним корисним способом розширення обох моделей є включення замовлення, де позитивні показники відповідають команді "додому", а негативні - "гостям" команди. Додавання в перехоплюючий термін до моделей може потім трактуватися як "перевага домашнього поля". Інші розширення можуть включати в себе включення шансів зв’язків у Моделі 1 (це фактично вже є можливістю в Моделі 2).
Побічна примітка : Принаймні один з комп'ютеризованих опитувань ( Пітер Вулф ), який використовується для серії чемпіонатів з чаш в американському футбольному коледжі, використовує (стандартну) модель Бредлі – Террі для складання рейтингу.