Перевірка раціоналізації чистої стратегії


2

Розглянемо статичну, повну інформаційну гру з 2 гравцями.
Набори стратегій - $ S_1 = {U, D}, S_2 = {l, m, r} $.

Виплати не мають відношення до цього питання, оскільки я намагаюся виправити концепцію раціоналізації.

Припустимо, я хочу перевірити, чи є $ m $ раціоналістичною стратегією для гравця 2.

Потім я хочу задати наступне запитання:

$ існує sigma_1 = (q ^ *, 1-q ^ *) в Delta (S_1) $ такому, що для $ sigma ^ * _ 2 = (0,1,0), $ $ u_2 (sigma_1, sigma ^ * _ 2) geq u_2 (sigma_1, sigma_2) $ для всіх $ sigma_2 в Delta (S_2)?

Тепер, припустимо, що маю матрицю виплат так, що я міг би знайти $ (q ^ *, 1-q ^ *) $ такий, що він задовольняє як:

(1) $ u_2 (sigma_1, sigma ^ * 2) geq u_2 ((sigma_1, (1,0,0)) $
(2) $ u_2 (sigma_1, sigma ^ * 2) geq u_2 (sigma_1, (0,0,1)) $.

Це означає, що я міг би знайти дійсний діапазон $ q ^ * $ такий, що для гравця 2, вибір $ m $ забезпечує слабкіше виграш для неї порівняно з виродженими (тобто чистими) стратегіями $ l $ або $ r $.

Моє запитання:

Якщо я міг би знайти такі $ q ^ * $, які задовольняють як (1), (2), то я не повинен перевіряти будь-які інші профілі стратегії в $ Delta (S_2) $, тобто будь-яке опуклене комбо $ ( 1,0,0) $ і $ (0,0,1) $? Моя інтуїція полягає в тому, що для будь-якого $ alpha в [0,1] $ я можу просто мати:

(1) '$ alpha u_2 (sigma_1, sigma ^ * _ 2) geq alpha u_2 ((sigma_1, (1,0,0)) $
(2) '$ (1 - альфа) u_2 (sigma_1, sigma ^ * 2) geq (1 - альфа) u_2 ((sigma_1, (0,0,1)) $.

і показують, що (1) '+ (2)' має на увазі вироджену стратегію $ m $ для гравця 2 є найкращою відповіддю на деяке переконання, $ \ t Отже, суть (1), (2) є достатньою, і я не повинен перевіряти опуклу комбо двох інших чистих стратегій.


1
Я думаю, що ваше розуміння правильне. Фактично, аргумент подібний до стратегічного домінування зі змішаними стратегіями. Див. Обговорення на стор.240-242 MWG.
Herr K.

@HerrK. Так. Дякуємо за посилання. Я прочитав його, і він щось говорить про це. Зрозуміло, що якщо ви намагаєтеся побачити, чи змішана стратегія для гравця $ I $ суворо домінує інша в його симплексі, вам потрібно лише перевірити проти вироджених (чистих) стратегій суперника, оскільки їхня опукла комбо збереже замовлення. Зручність, якою ми можемо скористатися, тому що ми не повинні перевіряти проти всіх розподілів ймовірностей у симплексі суперника.
Frank Swanton

Відповіді:


3

Так. Як правило, набір найкращих відповідей завжди є сумішшю над безліччю чистих найкращих відповідей. Зокрема, ніколи не існує суворих стимулів грати в змішану стратегію, гравець, який грає змішану найкращу відповідь, байдужий між усіма чистими стратегіями в підтримку змішаної стратегії. Все це випливає з лінійності очікуваної корисності.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.