Обчислена версія версії рівноваги Неша?


14

Мені цікаво, чи існує обчислювально обмежена версія концепції рівноваги Неша, щось у наступних рядках.

Уявіть собі якусь ідеальну інформаційну гру для двох гравців, яка грається на дошці, і яка є складною в тому сенсі, що оптимальна гра є ЕКСПЕТИЧНО-важкою. Припустимо також для простоти, що малювати неможливо. Уявіть пару рандомізованих багаточленних машин Тьюрінга, які грають у цю гру один проти одного. Для кожного , нехай ймовірність того, що б'ється на порядок гри. (Для конкретності, скажімо, що має грати спочатку з вірогідністю 0,5.) Я думаю, що було б круто - це, якби можна було довести існування парин×н(А,Б)нpА,Б(н)АБнА(А,Б)з властивістю того, що жодна рандомізована поліномальна машина Тьюрінга домінує над (де" домінує над означає для всіх досить великих ) і аналогічно жодна рандомізована поліномальна машина Тьюрінга домінує над (де " домінує над "означає для всіх досить великих ).А' АА'АpА',Б(н)>pА,Б(н)нБ'ББ'БpА,Б'(н)<pА,Б(н)н

Я якось підозрюю, що на це надто сподіватися, але чи є така надія, щоб щось подібне було правдою, можливо, для обмеженого класу ігор?

Однією з мотивів цього питання є те, що я шукаю спосіб формалізувати уявлення про те, що дана шахова позиція є «вигідною для білих». Класично позиція або є виграшю для білих, або її немає. Однак шахісти, як люди, так і комп'ютери, мають інтуїтивне розуміння того, що означає для Білих перевагу. Здається, це має щось спільне з ймовірністю того, що білі переможуть, враховуючи, що гравці обчислюються обмеженими і повинні вгадати найкращим кроком. Для конкретної пари рандомізованих алгоритмів, звичайно, можна говорити про ймовірність того, що Білий переможе, але мені цікаво, чи може у певному сенсі бути канонічним пара обчислювально обмежених гравців, ймовірність виграшу яких дає значення для позиції, що залежить лише від самої гри, а не від ідіосинкразії гравців.


Обчислені нами обчислювальні поняття рівноваги, які я знаю, мають різний аромат - мислення Гальперна, Паса і Семана, як у « Істині за міфом народної теореми» , 2014. Тут ми не припускаємо, що знаходимо стратегію рівноваги для даної гри. важко (тому що для даної гри це може бути, а може і не бути). Швидше, ми дозволяємо будь-якій встановленій стратегії бути рівноважною, якщо будь-якому гравцю важко обчислити вигідне відхилення. (Зверніть увагу, це передбачає експоненціальний простір стратегії, інакше ми можемо перевірити всі відхилення.)
usul

Відповіді:


1

Я не можу подумати про будь-який спосіб, на це питання може бути проста, абсолютно елегантна / задовольняюча відповідь, особливо тому, що закінчення виплат так важко підрахувати; однак, мої думки занадто тривалі, щоб розмістити коментар.

Найкраща у мене ідея така: У випадку з шахами спробуйте наблизити ймовірність того, що Білий виграє, виходячи з матеріальної переваги Білого (тобто додаткових пішаків, лицарів тощо) для даної позиції, вибравши випадковим чином позиції з такою точною сумою. -конфігурація матеріалу. Можливо, у випадку з "шаховими всероками" ми могли б сказати: "Яка ймовірність, що Білий виграє з 8 гратами до 17 граків Блек?" Можливо, ця ймовірність становить 4%; Щоб обчислити це, нам доведеться вивчити (скажімо) 1000 різних випадково створених шахових позицій, у яких є 8 білих граків та 17 чорних граків, а потім поглянути вперед (скажімо) 10 просувань у кожному випадку в глибину, і подивитися, яка нова конфігурація матеріалу . Потім візьміть очікувані шанси на основі конфігурації матеріалу в кінці,

Звичайно, потрібно було б знайти конфігурацію матеріалу для кожної відповідної можливості ( M , N ) від M білих граків до N чорних граків ... імовірно, починаючи з найнижчої упорядкованої пари ( M = 1, N = 1) і працюючи звідти

Для вихідної позиції не просто йдіть зі статистикою, яку ви отримуєте (тобто, якщо вихідна позиція має ( M = 6, N = 7) граків, не просто вважайте, що "Білі" мають 25% шансів на перемогу, тому що це очікувані шанси на перемогу (6,7)); натомість, оскільки ви можете бути більш точними, подивіться на 10 рухів углиб, як завжди, лише за допомогою цієї однієї позиції та знайдіть усі можливі закінчення. Потім знайдіть правильний шлях (який передбачає оптимальну гру обох сторін) до 10-ти глибокої конфігурації та виберіть очікувані шанси цього шляху як очікувані шанси вихідної позиції.

Я думаю, що цей процес можна здійснити за багаточлен. Дивлячись, що k рухається глибоко для фіксованого k у шахах, є багаточленним розміром дошки, а загальна кількість білих та чорних граків виражається унарними (у певному сенсі), оскільки ця кількість повинна бути меншою за розмір дошки.

Якщо це звучить складно і важко пояснити, це так. Більш короткий підсумок того, що я описую: Використовуйте рекурсію та основні статистичні дані, щоб обчислити шанси на перемогу для білих, заданих M білими граками та N чорними граками на дошці. Потім використовуйте ці значення, щоб переглянути k рухається глибоко і встановити шанси, що білі виграють у вихідній позиції.

Заключний коментар: Я думаю, що ця проблема цікава також для ігор, що не завершуються EXPTIME, таких як тик-так-носок, який, згідно Вікіпедії, є повним PSPACE. Далі я вважаю, що такий процес, як той, який я описав вище, теж може бути корисним там, хоча очевидно було б неможливо мати «матеріальну» перевагу в тик-так-нозі; мала б бути якась інша основа для судження переваги позиції X чи O.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.