Яким би було Ело комп’ютерної програми, яка відтворює випадкові рухи?
Для простоти припустімо, що він ніколи не просить розіграшу чи відставки і ніколи не приймає пропозицію розіграшу.
Яким би було Ело комп’ютерної програми, яка відтворює випадкові рухи?
Для простоти припустімо, що він ніколи не просить розіграшу чи відставки і ніколи не приймає пропозицію розіграшу.
Відповіді:
Справа внизу списку рейтингу комп'ютерних шахів для контролю часу 40/4 знаходиться Brutus RND, двигун, який просто вибирає випадкові легальні кроки.
Він має рейтинг 205 (станом на 6.06.2018). Це, звичайно, не рейтинг FIDE, але він використовує систему Elo.
Має 0 перемог, 242 програші та 64 нічиї. Нічия пов'язані з несправними програмами, які випадково викликають нічию шляхом повторення або періодично застою, хоча вони, як правило, мають істотну матеріальну перевагу, коли це відбувається.
FIDE має рейтинг 1000. Брут RND просто не зможе встановити високий рейтинг і був би неоцінений.
Якщо проігнорувати рейтинг FIDE, то за системою Elo можливий негативний рейтинг.
Одним із зазначень є те, що FIDE використовує таблицю для обчислення змін у рейтингу, і якщо різниця в рейтингу перевищує 735, жодних змін не відбувається, коли виграє сильний гравець. Це означає, що Брутус ніколи не міг мати рейтинг -5000 або щось подібне, тому що йому потрібно було б втратити очки вражаюче некомпетентним гравцям, які не змогли б поставити мат.
https://www.fide.com/component/handbook/?view=article&id=197
Ми залишилися здогадуватися тут. 1000 гравців з рейтингом «Ело» змогли би знизити рейтинг Брута до 265, але оскільки немає гравців з гіршими рейтингами, ми не можемо точно сказати, наскільки далі вони могли би знизити рейтинг Брута, якби вони існували.
Я б здогадувався, що гравці, які мають 500 Elo або гірше, матимуть проблеми з послідовною доставкою матерів, як і несправні програми. Нічия в 3-кратному повторенні або в правилі 50 переміщення не є автоматичними згідно з правилами FIDE, і відбуватимуться лише за умови, що Брут заявив на них. Але людина може втратити, вичерпавши час, а також малювання випадковою тупиком.
Тож я здогадуюсь десь у діапазоні від -200 до 200, якщо FIDE дозволила рейтингам нижче 1000 та дозволила Бруту змагатися.
Проблема з випадковою грою полягає в тому, що в середній шаховій позиції багато безлічі рухів (від 20 у відкритті до легко 50 або більше у складних ендграх), але прийнятна лише жменька з них. Випадкові ходи призведуть до тотальної координації з самого початку гри. Більше того, захоплення менш цінних творів було б дуже поширеним, особливо в середній грі. Це говорить, навіть проти надзвичайно слабкого протистояння, комп'ютер, в кінцевому рахунку, буде помилятися: тонни матеріалів будуть торгуватися і, можливо, не так багато користі для комп'ютера, комп'ютер буде, безсумнівно, нерозвинений, його король не буде безпечним і можливо, навіть не заграли ...
Стільки поганих речей, що накопичуються, і дуже швидко призведуть до справжньої поразки машини. Його Ело, ймовірно, буде 0 FIDE.
Я не знаю , як Go рейтинги порівняти з шахами, але випадкова гра про -3500 там . Оскільки коефіцієнт розгалуження шахів нижчий, я б очікував, що випадковий гравець ело буде вище, можливо, десь від -2000 до -500.
Гірше, ніж абсолютний новачок, який ледве знає правила гри, тому що принаймні новачок вкладає певну думку у вибір ходу. Їх кроки все ще можуть бути переважно випадковими, але, принаймні, існує деяка оцінка позицій.
Тож рейтинг цього двигуна був би на найнижчому можливому поверсі будь-якої рейтингової системи, яку ви вибрали. Зрештою, це може виграти або розіграти гру з не менш поганим суперником, а потім збільшитись на кілька очок. Однак ви можете очікувати, що рейтинг двигуна швидко знизиться до мінімальної поверху.
У програмі Шеннона "Програмування комп’ютера для гри в шахи" він зазначає, що ймовірність випадкового побиття Ботвінника становить порядку 10 ^ -75. Таким чином, якщо цей випадковий комп'ютер повинен був грати в Ботвінника (або навіть звичайного майстра) нон-стоп протягом життя людини, ми можемо з розумом очікувати, що він ніколи не виграє.
Однак Шеннон продовжує говорити, що випадкова гра - не найгірша стратегія; найгірша стратегія - навмисне грати рухи, які допомагають опоненту. Незважаючи на те, що повний новачок міг би це зробити, велика ймовірність, що вони спробують грати в рухи, які покращують власну позицію.
Дуже гарною відповіддю було б це зробити:
Використовуйте numpy, дуже слабкий ігровий движок, 1500 ELO або близько того, і додайте до нього скрипт python. Є багато бібліотек, які надають вам можливі рухи в положенні, тому ми можемо вибрати одну навмання. Я опублікую результати пізніше.
http://creative-co.de/random_chess/
Ви також повинні це перевірити.