Пояснення змішаних стратегій для одиночних ігор


13

У класичному вступі до теорії ігор, що не співпрацюють, змішана стратегія гравця викладається як розподіл по стратегічному простору для гравця. Розподіл по суті дає нам ймовірності (скажімо, дискретний набір стратегій), з якими гравець повинен грати стратегії в рівновазі Неша.

Однак ймовірності несуть поняття частоти, і це по суті означає довгострокову фракцію ігор, в яких гравцеві слід грати стратегію. Однак налаштування - це гра в один удар, і це суперечність.

Як ми вирішуємо протиріччя, пояснюючи, що таке змішана стратегія?


2
Це не протиріччя тому, хто сприймає схильність до інтерпретації ймовірності, який розглядає поведінку на тривалий час як прояв одиничних випадкових ймовірностей.
Пбург

Відповіді:


11

Аріель Рубінштейн прагне проникливо ставитися до таких питань.

Він розглядає тлумачення змішаних стратегій у розділі 3 цього документу.

Кілька можливих тлумачень окрім навмисної рандомізації:

  1. Очищення: Змішана стратегія - це план дій, заснований на інформації, не вказаній у моделі.
  2. Вигадана історія довгого часу.
  3. Населення в середньому, тому уявіть, що гравця витягнули з деякого розподілу населення, де різні типи грають різні чисті стратегії. Розподіл населення - це змішана стратегія розподілу.

iii

Змішану стратегію можна розглядати як переконання всіх інших гравців щодо дій гравця. Змішана стратегічна рівновага - це n-набір очікувань загальних знань, який має властивість, що всі дії, яким призначається суто позитивна ймовірність, є оптимальними, враховуючи переконання. Поведінка гравця може сприйматись усіма іншими гравцями як результат випадкового пристрою, хоча це не так. Прийняття такої інтерпретації вимагає переоцінки значної частини застосованої теорії ігор. Зокрема, це означає, що рівновага не призводить до прогнозування (статистичного чи іншого) поведінки гравців. Будь-яка дія гравця, яка є найкращим відгуком, враховуючи його очікування щодо інших гравців поведінка (інші n - 1 стратегії) узгоджується як передбачення дії i (це може включати дії, які не підтримують змішану стратегію). Це робить безглуздим будь-який порівняльний статичний аналіз або аналіз добробуту змішаної стратегічної рівноваги і ставить під сумнів величезну економічну літературу, яка використовує змішану стратегічну рівновагу.


6

si={pAi,pBi}A,Bs={si,si}i

sis

Принаймні, при рівновазі зі змішаною стратегією ми знаємо ймовірність виникнення кожної з рівноваг. Вам не подобаються ймовірності в тій мірі, коли вони несуть частоти, що, на вашу думку, суперечить уявленню про гру в один удар.

spA{A,A}pB

stδ0

TTpA{A,A}


2

Це доповнення цитати Пбурга:

NS:=×iNSisS

  1. iπi:SSiiisiπi1(si)πi1(si)si
  2. Aiiai:SAiai|πi1(si)
  3. igiaig(s):ARsπi1(si)si

1

Що ж, ось моя відповідь, відповівши на цю статтю в розділі «Фізика» http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf. Я думаю, що схильність - це приємна інтерпретація змішаних стратегій, але формальніше слід сказати, що вона захоплює незнання модельєра. Ми кажемо, що завгодно, адже всі стратегії можуть бути прийняті (якщо підтримка є скрізь позитивною), але концепція рішення говорить, що певні більш ймовірні. Ймовірності тут вимірюють незнання модельєра і є наслідком недостатньої інформації теоретика гри про гру. Для уточнення цієї думки про розширений набір даних, де ми знаємо додаткову інформацію про гру, скажімо, ми розмовляємо з одним із гравців, він запевняє нас, що він буде приймати одну стратегію незалежно від того, тоді ми можемо зробити більш чіткий прогноз у форма чистої стратегії. Частота виникає, коли ми вважаємо гру типовою грою,


0

Це стосується не всіх ігор, але також існують ситуації, коли гравці (принаймні деякі з них) насправді використовують пристрої рандомізації в іграх, які можна розглядати як один удар. Тут розподіли ймовірностей - це не частоти, це розподіли, які використовує пристрій рандомізації. Будь-яка змішана стратегія рівноваги є рівновагою в попередньому сенсі (хоча гравці можуть дуже добре витягнути з пристрою рандомізації одноразово, і не може бути сенсу, в якому ситуація, що склалася після, є рівновагою).

Приклади включають:

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.