Чому FIDE все ще використовує Elo?


11

Мене вразило те, як працює рейтингова система Glicko . Зокрема:

  • більше ігор, що грали останнім часом, викликають стабілізацію рейтингу
  • менша кількість ігор, що відбулися останнім часом, змушують коливатися у вашому рейтингу, поки ви не отримаєте кілька останніх ігор під поясом

USCF кілька років тому змінив свою систему на схожу (там, де є ковзаюча шкала для посилення або зменшення зміни рейтингу для даного матчу), і тепер, коли Глікман (винахідник Гліко) знаходиться на рейтинговій дошці для USCF, Я думаю, що з часом вони приймуть ще більш гнучку систему, як його власну.

Чи є причина (за винятком того, щоб бути стійкими до змін, або що вони просто ще не досягли цього), що FIDE не застосовує більш точну систему оцінювання?

Відповіді:


9

Не доведено, що Глічко є більш точним. Гліко просто вирішує проблему по-іншому, з різним акцентом. Вважайте, що всі ці системи абстрагують людський розум до чотиризначного числа.

У рейтингах багато політики; це дотична тема. Якби FIDE прийняв його, вони створили б новий список найкращих 100, і багато ГМ, швидше за все, будуть засмучені.

Систему ELO дуже легко зрозуміти; прозорість важлива. Більш складні системи мають негайні недоліки.


6
+1, хоча я не погоджуюся з першим абзацом, все інше досить правдиве. 1) Глічко виявляється в середньому точнішим (вимірюється через те, наскільки часто він може передбачити, хто виграє даний матч). 2) Щодо абстрагування людського розуму до числа, це насправді не так. Це міра майстерності, яка дозволяє обчислювати ймовірності (для виграшу / нічиї / програші) при порівнянні рівнів навичок. Це все підкріплене математикою та статистикою. У Glicko-2 є навіть новий фактор для волатильності для тих гравців, які грають непослідовно (дозволяючи рейтингу коливатися більше).
Єва Фріман

1
Цікаво. Однак я запевняю, що "в середньому краще" не обов'язково "краще". Що робити, якщо часи, коли вона не є більш точною, завдають фактичної шкоди? Але я піду читати на цьому.
Тоні Енніс



7

Наскільки я розумію, рейтингова система Glicko додає показник надійності до рейтингового числа, що може забезпечити більш високу справедливість щодо розрахунків коригування рейтингової оцінки. Очевидно, це може призвести до помилкового припущення про наявність кореляційного зв’язку між грою в рейтингові ігри та результуючою ігровою силою (оскільки не граючий знижує показник надійності, який у свою чергу дещо знецінює ваш рейтинг). Я бачу чимало проблем, пов’язаних із оцінкою надійності, хоча, маю визнати, я не знаю, що стосується тонкощів системи. Просто вибрати три:

  • Гравець, який грає лише в рідкісну гру, може більше не отримувати запрошень. Уявіть, що ви директор турніру, який запрошує привабливих гравців. Тепер ви повинні вибрати між 10 гравцями, усі з яких мають однаковий номер рейтингу, але різні показники надійності. Ймовірно, ви найперше підберете ті, які мають найкращі показники надійності. З часом розрив у надійності між гравцями з багатьма іграми та меншими рейтингами може розширитися.
  • Маніпуляція рейтинговими номерами може стати простішою. Навіть система ELO не є надійною, оскільки деякі люди отримували рейтинги або норми IM / GM, граючи в турнірах. Хороший показник надійності може допомогти гравцям, які не мають надійності, дуже дешевим - хороший гравець дає рейтингові бали, не втрачаючи при цьому багато. Як тільки гроші залучаються, важливим питанням є безпечний обман. У мене таке відчуття, що рейтингова система Гліко більше схильна до маніпуляцій.
  • Спілкування та розуміння ігрової сили може стати більш важким для маси. Коли ви повідомляєте рейтинговий список, у вас виникають проблеми. Гравець з рейтингом 2000-50 має "справжню ігрову силу" десь між 1900 та 2100. Інший гравець отримав 1950-2000, що означає число в діапазоні 1750 і 2150. Отже, гравець з 1950-2000 насправді може бути кращим гравцем, але, ймовірно, він буде займати нижче іншого, тільки тому, що він грав менше ігор або проти менш надійних супротивників. Ви ускладнюєте пояснення вашої системи ранжування людям, не гарантуючи дійсності більшої справедливості. ГМ, який перестає грати, може набрати "потенційну силу" та похвалитись своїм потенціалом світового чемпіона, оскільки його кількість надійності дозволяє збільшувати місце для відхилень (пам’ятайте:

Підсумовуючи це: Ви можете отримати більше, ніж ви торгувались, тому що весь пакет не лише вдосконалюється. А оскільки виникають важкі монетарні проблеми, коли ви дивитесь у верхньому кінці рейтингових списків, я не бачу достоїнств у зміні існуючої системи.


Більшість рейтингових списків мають обмеження для оцінки надійності (RD), а не намагаються використовувати його для ранжування гравців. Таким чином, 2000 (50) завжди було б вище, ніж 1950 (100). За їх нинішнім рейтингом вони вищі, незалежно від надійності. Якщо гравець 1950 (100) виграв би проти 2000 (50), їх рейтинг збільшиться значно більше, ніж якщо б вони були 1950 (50). Чи можете ви описати, як можна обдурити систему з Глічко більш докладно? Ви говорите про те, що ви оцінюєте пісок, якщо у вас високий рівень розвитку?
Єва Фріман

@West Freeman: Я сумніваюся, що це ідеальне місце, щоб довести відносну схильність до рейтингової системи, і я просто гадаю, тому що мені здається дешевше маніпулювати системою, оскільки я не втрачу стільки рейтингових балів себе, коли навмисно програю проти неоціненого гравця. Більш важливим моментом моєї відповіді є те, що ви повинні перевірити систему не лише на справедливість розрахунків, але на схильність до обману, комунікабельність тощо, перш ніж викинути робочу систему.
Рей

Але як штучно підвищувати чийсь рейтинг їм допомагає? Зазвичай люди, які намагаються грати в систему, намагаються знизити свій рейтинг, щоб вони могли грати в нижніх секціях і виграти перший приз. Це може бути простіше з Glicko, якщо ви не будете грати протягом тривалого періоду часу, а потім програєте кілька ігор, які ви повинні були виграти. Але в поєднанні з рейтинговими поверхами і тим, що це можна робити лише раз у раз через те, що РД потребує часу, щоб повернутися назад.
Єва Фріман

1
Можливо, вам знадобляться високі рейтинги, щоб отримати титул, отримати запрошення або заплатити клубам, щоб грати за них або працювати тренером. Я говорю про професійні шахи тут і про те, де справжні гроші, тому що ви поставили під сумнів поведінку FIDE.
Рей
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.