Це дуже важлива концепція, коли КОТХ передбачає відносно простий набір рішень, передбачає лише декілька гравців (як правило, 2) та є детермінованим. Рівновага Неша описує позицію "блокування": якщо два гравці визначилися з двома стратегіями, то два гравці будуть фактично заблоковані на цих позиціях: будь-який гравець, що змінює свою стратегію, просто створює додаткові вразливості.
Прикладами ігор, де важлива рівновага Неша, є:
- Ножиці Rock-Paper-Scissors (-Lizard-Spock), у яких "неперевершена" стратегія - випадкова гра
- Морра , який має "спектр" рівноваг. Пітер Тейлор написав хороший приклад у своїй відповіді тут .
- Ділема в'язня, спільна гра, що відрізняється тим, що "заблукали всі"
Як знайти рівновагу
Знайти рівновагу насправді досить просто для більшості простих ігор і часто досить інтуїтивно зрозуміло. Тонну деталей з різноманітними методами можна знайти в Інтернеті. Основна концепція, яка зазвичай застосовується, полягає у створенні списку можливих стратегій, які можуть використовувати два гравці (варіанти, які надає гра). Якщо в одній стратегії "домінує" інша, то цю стратегію можна видалити зі списку, і процес повториться. Під "домінуванням" я маю на увазі, що якщо стратегія А завжди дає рівноцінний або кращий результат, ніж стратегія B, проти всіх решти стратегій противника, то стратегію B можна видалити зі списку.
Приклад: Ножиці-папір-папір
У RPS є щось, що називається "змішаною" рівновагою, що означає розподіл . Замість того, щоб грати в один і той же рух кілька разів (що призведе до швидкої поразки), рівновага полягає в тому, щоб грати 1/3 рок, 1/3 папір та 1/3 ножиці у випадковому розподілі. Якщо я граю навмання, мій противник нічого не може зробити, щоб отримати перевагу на мені, період. Якщо мій опонент вирішить не грати випадково, то це лише створює вразливість з його боку.
Ігри зі змішаною рівновагою, мабуть, найпоширеніші в PPCG, оскільки вони можуть приймати різні форми ( єдина цікава гра, яку я можу придумати з чистою рівновагою, - це дилема в'язня). Зазначу, що змішана рівновага не повинна бути рівномірно випадковою , просто щось інше, ніж щоразу грати в один і той же рух.
Використання цієї інформації
Рівновага Неша в грі часто являє собою "базову лінію", з якою вам слід спробувати оперувати. У RPS грає випадковим чином, гарантує фінішне місце біля середини пакету. Для того щоб перейти до вершини, ви повинні почати виявляти слабкі сторони іншого гравця.
Для цього вам слід дотримуватися рівноваги, коли не знаєте слабкості противника. Після виявлення цих слабких сторін (ви виявили, що ваш опонент не перебуває в рівновазі), тоді вам потрібно обережно вийти з рівноваги, щоб скористатися своїм супротивником. Ця дія, в свою чергу, створює ваші слабкі сторони. Тоді ви повинні виявити, коли ваш опонент змінює свою стратегію, щоб потім ви могли зупинити атаку і відновити випадкову гру.
Виявлення варіації від рівноваги
Це досить складно, і я не фахівець. Варіації можуть бути різними:
- Улюблені деякі варіанти вище / нижче інших без будь-якої причини, наприклад, плеєр RPS, який грає в рок удвічі частіше, ніж ножиці, або той, що уникає відтворення паперу. Деякі відносно прості статистичні дані можуть це виявити.
- Обгрунтування поточного відхилення від минулих ходів за деякою передбачуваною схемою. Сюди входять коти-копії, боти "б'є те, що б'ється за твій останній хід", або "катання на велосипеді". Це потребує додаткової логіки для виявлення, оскільки загальний розподіл ходу може бути розподілений рівномірно, навіть якщо ходи не є випадковими. Вам слід спробувати взяти запис рухів і знайти кореляції на кшталт "хід, який я зробив 2 оберти тому, і хід, який зробив мій опонент зараз", і "хід, який він зробив 1 оборот назад, і хід, який він зробив зараз", і т.д.
- Ботів, чий розподіл переміщення базується на ваших. Уразливість в цих ботів часто не створюється (в вимірюваної величини) до тих пір , після того, як ви самі не варіювали від випадкового розподілу. Взагалі, ваш власний бот підпадає під цю категорію.