Алгоритми обчислення рівноваги Неша.


10

Я шукав на форумі, щоб перевірити, чи про це вже задавались, і поки обговорюється алгоритмічна теорія ігор, я не зміг знайти цю проблему. Я намагаюся розібратися, який найвідоміший алгоритм для обчислення приблизної (змішаної стратегії) рівноваги Неша в кінцевій грі з людиною. Звичайно, цей алгоритм був би PPAD. Мене більше цікавить швидкість / ефективність, ніж ідеальна точність алгоритму.

Спасибі, Філіп


Ми можемо допомогти вам краще, якщо ви дасте більше деталей. Наприклад, яке значення ви маєте на увазі? Чи маєте ви на увазі якусь особливу структуру функції виплат? Вам справді потрібна рівновага Неша чи вистачить співвіднесеної рівноваги? Ви шукаєте щось із хорошими досяжними межами чи щось із хорошими практичними показниками? n
Воррен Шуді

Відповіді:


7

Коротка відповідь полягає в тому, що, хоча існують кілька поліноміальних алгоритмів часу для того, щоб довести значну приблизну рівновагу Неша, всі вони знаходять відносно погані наближення - напевно, недостатньо добре, якщо ви насправді намагаєтесь знайти алгоритм для гри. Більше відомо 2 гри гравців, ніж ігри для n гравців.

Якщо те, що ви намагаєтеся зробити, це насправді знайти (приблизну) рівновагу Неша, однією з легких для кодування річ, яку ви можете спробувати, є імітація гри, при цьому кожен гравець використовує алгоритм рандомізованого зваженого більшості (http://en.wikipedia.org/ wiki / Randomized_weighted_majority_algorithm). Це не гарантовано спрацює, але у багатьох випадках буде (І це гарантовано для певних класів ігор, як-от ігри з нульовою сумою). Зокрема, якщо цей процес взагалі сходиться, гарантовано він перейде до рівноваги Неша. Небезпека полягає в тому, що вона не зблизиться і циркулює вічно - але навіть у цьому випадку емпірична історія гри зійде до набору грубо корельованих рівноваг.


Я почав розглядати папір, згаданий у відповіді вище. Я не зрозумів усе це (або багато чого на перший погляд) ... чи можете ви пояснити, чому наближення "відносно бідне?" Також ви могли б коротко пояснити, що таке «груба корельована рівновага»? Я знаю, що таке корельована рівновага, але що це означає для такого рівняння. бути грубим. Нарешті, що ви маєте на увазі під "емпіричною історією гри, яка зблизиться ... [тощо]"? Як може те, що ніколи не конвергується, сходиться до набору CCE? Дякую за вашу відповідь, я зараз шукаю статтю у Вікіпедії.
Філіп Уайт

Для ознайомлення з алгоритмами, які виробляють розподіли, що сходяться до грубо корельованих рівноважних або корельованих рівноважних, я б почав тут: cs.cmu.edu/~avrim/Papers/regret-chapter.pdf
Аарон Рот

Якщо ви хочете співвідносити рівновагу, а не грубу корельовану рівновагу, ви можете використовувати школяра, який не має внутрішнього жалю. Наприклад (безсоромний штекер) cs.brown.edu/~ws/papers/regret.pdf . Існують також алгоритми для обчислення корельованих рівноваг безпосередньо в многочлен.
Воррен Шуді


4

Якщо вас цікавлять алгоритми, реально реалізовані в програмному забезпеченні, я знаю кілька:

  1. пакет GAMBIT (http://www.gambit-project.org/doc/index.html) реалізує декілька алгоритмів рівноваги Неша для нормальної форми для двох гравців та n-гравців, а в деяких випадках для ігор широкої форми.

  2. GameTracer (http://dags.stanford.edu/Games/gametracer.html) реалізує алгоритми GNM та IPA Govindan & Wilson для ігор у звичайній формі для n-гравців.

  3. Для великих ігор нормальне представлення форми є проблематичним, оскільки розмір збільшується в експоненціальній кількості гравців. Натомість, якщо утиліта функції вашої гри має певні типи структури, ви можете використовувати «стисле подання» (наприклад, графічні ігри, симетричні ігри, ігри-графіки), щоб виразити її, використовуючи набагато менше місця; і крім того, структуру часто можна використовувати для обчислювальних прискорень. Що стосується програмного забезпечення, AGG Solver (http://agg.cs.ubc.ca) адаптує алгоритм GNM GameTracer та алгоритм simpdiv GAMBIT до представлення гра-гра (AGG). (Відмова: Я беру участь у розробці цього програмного пакета.)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.