Стратегії домінували в грі безмежно проти остаточно повторюваних


4

Як концепція слабкого домінування працює з нескінченними іграми? Достаток понять здається каламутним.

Зокрема, припустимо, що два гравці наступну гру грають нескінченну кількість разів.

ABA1,10,0B0,00,0

У однотактний іграх, то ясно , що гра слабо домінує дія B .AB

Однак що робити, якщо ми вважаємо химерний вид похмурого тригера:

  1. У перший період, гравець грає B .
  2. Якщо в першому періоді грав другий A , грайте в B назавжди.
  3. В іншому випадку, грати A назавжди.

Для пацієнта, який достатньо пацієнта, найкраще реагувати на цю стратегію тією ж стратегією. Будь-яка стратегія, яка починається з B а потім A є найкращою відповіддю (деталі в дорозі можуть бути різними, так що найкраща відповідь може не зазначати B назавжди, якщо інша вибере A на початку).

AA

ss


Яка саме функція окупності супер гри? Знижена сума окупності ігор з одним вистрілом, середня окупність ігор за одну стрілку?
Giskard

На сьогоднішній день жодна стратегія не може бути кращою, ніж просто грати A кожен раз. Це залишається правдою незалежно від того, скільки разів грається. Для уточнення, Ваша думка полягає в тому, що інші стратегії не гірші , тому Ви хотіли б знати, як їх усунути?
Регрес вперед

@RegressForward: Загальна виграш якимось чином випливає з окупності всіх ігор на один удар. Якщо припустити, що це дисконтована сума виплат за один удар і коефіцієнт знижки : Якщо в повторній грі, якщо інший гравець грає вищевказану стратегію, я отримую виграш , граючи одну і ту ж стратегію і виграш 0, граючи кожен раз. δ
0+δ+δ2+δ3...=δ1δ
A
Giskard

Ах, пропустив застереження "must-play-B" в тригері, ти.
Регрес вперед

@denesp Сума зі знижкою.
Пбург

Відповіді:


3

Звичайна концепція вдосконалення, що використовується для боротьби зі слабкими стратегіями, - це ідеальна рівновага тремтячої руки . (Я не знаю інших, але цей працює досить добре.

У стратегії, про яку йдеться, дійсно слабо переважає наступна стратегія

  1. У перший період, гравець грає .B
  2. У всіх інших періодів, гравець грає .A

TH - це уточнення NE, а не домінування (і питання про домінування, а не NE).
Всемогутній Боб

@TheAlmightyBob Є два питання. Одне полягає в тому, чи домінує зазначена стратегія (у нескінченно повторюваній грі). Інший - "Які існують ідеї, щоб виключити тип стратегії, описаної вище?" Це дійсно вдосконалення НЕ саме з цією метою.
Giskard

3

Проблема, яку ви згадали, полягає в тому, що домінування насправді не використовується часто. Це дуже слабке поняття в тому сенсі, яке зазвичай не має «зчеплення», тобто не багато стратегій усуваються. Ось чому ми використовуємо рівновагу Неша або навіть інші поняття (наприклад, тремтяча рука ідеального рівноваги, про яку згадував @desnesp, або, якась форма вдосконалення підгрунтя).

І це не має нічого спільного з безмежно чи нескінченно повторюваними іграми, це справедливо для кожної повторної гри (або кожної гри загалом).

У кінцево повторюваних іграх єдиними стратегіями, які слабо домінують (у вашому прикладі), є стратегії, які грають на в останньому раунді, враховуючи деяку історію.B

Дозвольте вам показати: Зрозуміло, що в ньому переважають (просто перейшовши на в останньому раунді цієї історії).A

Тепер інший напрямок: Припустимо , що існує домінувала стратегія , яка грає в останньому турі, тобто стратегія , яка грає всюди, але якщо ви грали , то грає в останньому турі. У цій стратегії суворо краща за будь-яку іншу стратегію і тому не домінує.SABSAS

Як це працює для нескінченно повторюваних ігор ? Таким же чином: Ви думаєте, що домінує, і у завжди є шанс, що буде відіграно пізніше? Тоді є стратегія, яка грає тоді, iff грав. (Я знаю, що це трохи неохайно, але я сподіваюся, що ви все-таки зрозумієте.)SSAAS

Отже, коротше:

Чи сама стратегія, про яку йдеться, слабо домінує?

Так, наприклад, перемкнувшись завжди грати в в останньому раунді.A


У нескінченно повторюваних іграх (і питання про них) немає останнього раунду.
Giskard

Я знаю. Ось чому я пишу в кінцево повторюваних іграх. Я просто кажу, що проблема виникає і в кінцево повторюваних іграх. Це не проблема нескінченно повторюваних ігор, а домінування. Крім того, побудова контр-стратегії працює аналогічно.
Всемогутній Боб

0

Повторні ігри - це особливий клас ігор широкої форми. І якщо такі ігри допускають стратегічне представлення форми, застосовуються звичні поняття домінування:

Визначення 1. Чистий стратегія є слабо домінує для гравця , якщо існує (змішана) стратегія таким чином, що для всіх , і зазначена вище нерівність сувора принаймні для одного . siSiiσiΔ(Si)

(1)ui(σi,si)ui(si,si)
siSisi

і

Визначення 2. Чистий стратегія є слабо домінуючим для гравця , якщо кожна інша стратегія слабо домінує .siSiisiSi{si}si

Давайте застосуємо це визначення до вашого прикладу. Виклик двох гравців і , позначимо через похмуру стратегію запуску Ви пропонуєте по (якщо використовується гравцем і , якщо використовується ) і позначимо через гравця «S стратегія , яка грає незалежно історії (і аналогічно ).ijsiGisjGjsiAiAj

Як ви визнаєте, не є слабкою домінантою: не домінує , оскільки існує стратегія така, що . Але це не означає, що слабо домінує. Зокрема, вона не домінує . s G i s A i s G j u i ( s A i , s G j ) < u i ( s G i , s G j ) s A i s G isiAsiGsiAsjGui(siA,sjG)<ui(siG,sjG)siAsiG

У своєму підручнику з теорії ігор Фуденберг та Тіроль прокоментували це

Поняття про ітераційне суворе домінування поширюється і на ігри широкої форми; однак, як ми вже згадували вище, ця концепція має малу силу в найбільш обширних формах. Справа в тому, що гравець не може суворо віддавати перевагу одній дії над іншою в наборі інформації, яка не досягається з огляду на гру своїх опонентів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.