Розглянемо статичну, повну інформаційну гру з 2 гравцями.
Набори стратегій - $ S_1 = {U, D}, S_2 = {l, m, r} $.
Виплати не мають відношення до цього питання, оскільки я намагаюся виправити концепцію раціоналізації.
Припустимо, я хочу перевірити, чи є $ m $ раціоналістичною стратегією для гравця 2.
Потім я хочу задати наступне запитання:
$ існує sigma_1 = (q ^ *, 1-q ^ *) в Delta (S_1) $ такому, що для $ sigma ^ * _ 2 = (0,1,0), $ $ u_2 (sigma_1, sigma ^ * _ 2) geq u_2 (sigma_1, sigma_2) $ для всіх $ sigma_2 в Delta (S_2)?
Тепер, припустимо, що маю матрицю виплат так, що я міг би знайти $ (q ^ *, 1-q ^ *) $ такий, що він задовольняє як:
(1) $ u_2 (sigma_1, sigma ^ * 2) geq u_2 ((sigma_1, (1,0,0)) $
(2) $ u_2 (sigma_1, sigma ^ * 2) geq u_2 (sigma_1, (0,0,1)) $.
Це означає, що я міг би знайти дійсний діапазон $ q ^ * $ такий, що для гравця 2, вибір $ m $ забезпечує слабкіше виграш для неї порівняно з виродженими (тобто чистими) стратегіями $ l $ або $ r $.
Моє запитання:
Якщо я міг би знайти такі $ q ^ * $, які задовольняють як (1), (2), то я не повинен перевіряти будь-які інші профілі стратегії в $ Delta (S_2) $, тобто будь-яке опуклене комбо $ ( 1,0,0) $ і $ (0,0,1) $? Моя інтуїція полягає в тому, що для будь-якого $ alpha в [0,1] $ я можу просто мати:
(1) '$ alpha u_2 (sigma_1, sigma ^ * _ 2) geq alpha u_2 ((sigma_1, (1,0,0)) $
(2) '$ (1 - альфа) u_2 (sigma_1, sigma ^ * 2) geq (1 - альфа) u_2 ((sigma_1, (0,0,1)) $.
і показують, що (1) '+ (2)' має на увазі вироджену стратегію $ m $ для гравця 2 є найкращою відповіддю на деяке переконання, $ \ t Отже, суть (1), (2) є достатньою, і я не повинен перевіряти опуклу комбо двох інших чистих стратегій.