Система рейтингів Elo використовує алгоритм мінімізації градієнта спуску функції перехресної ентропії втрат між очікуваною та спостережуваною ймовірністю результату в парних порівняннях. Ми можемо записати загальні функції втрат як
де сума виконується за всіма результатами та всіма противниками n . p i - спостережувана частота події i і q i очікувана частота.
У випадку лише двох можливих результатів (виграш або програш) і одного суперника у нас є
Якщо - це рейтинг гравця i, а π j - рейтинг гравця j, ми можемо побудувати очікувану ймовірність як q i = e π i qj=e π j
де і p i - очікувана і спостережувана ймовірність виграшу гравця i проти гравця j . Це правила оновлення.two outcomes
За наявності жеребкувань ми можемо узагальнити описану вище модель, включаючи і третій результат з вірогідністю
qi(w)=eπi
І ми можемо побудувати функцію Loss як
win
loose
draw
win
loose
draw
three outcome
Питання в тому, чому система рейтингів Elo використовує two outcomes
правила оновлення навіть за наявності нічиїх?