Осборн, рівновага Неша і правильність переконань


12

У вступі Осборна до введення в теорію ігор рівновагу Неша описано так (с. 21–22):

По-перше, кожен гравець вибирає свою дію за моделлю раціонального вибору, враховуючи її переконання щодо дій інших гравців. По-друге, переконання кожного гравця щодо дій інших гравців є правильним.

Мені здається, що це визначення не зовсім еквівалентне звичайному визначенню рівноваги Неша як профілю стратегії, де стратегія кожного гравця є найкращим відгуком на стратегії інших.

Звичайне визначення нічого не говорить про переконання і тому допускає можливість того, що переконання можуть бути неправильними.

Щоб скористатися тривіальною можливістю, розгляньте дилему в'язня. Припустимо, кожен гравець вважає, що інший гравець не зізнається. Оскільки сповідь є домінуючою стратегією, кожен гравець все одно зізнається. Таким чином, дії складають рівновагу Неша, навіть якщо вірування гравців абсолютно протилежні дійсним рівноважним діям.

Я правий у цьому розумінні, що визначення Осборна характеризує щось інше, ніж рівновага Неша?


Це не означає: "Звичайне визначення нічого не говорить про переконання і тому допускає можливість того, що переконання можуть бути неправильними". Просто залежати від того, що у цих визначеннях ви завжди маєте основне припущення про раціональність?
Торст

Відповіді:


9

Представлення мови переконань тут трохи дивно, враховуючи, що вірування мають дуже специфічне значення в інших частинах теорії ігор.

Дійсно, опис Осборна нагадує рівновагу Байєса Неша. Ми могли б ввести поняття переконань у звичайну форму повної інформаційної гри наступним чином: припустимо, що з ймовірністю кожен гравець, я , є "стратегічним" типом, який буде грати відповідно до (Неша) рівноваги та з вірогідністю 1 - a i він обере якусь стратегію рівномірно (тому що, скажімо, він байдужий до всіх дій). Таким чином, у нас є байєсівська гра, де думати про переконання природніше.aii1ai

Концепція рішення Байєша Неша тоді говорить, що стратегія повинна бути оптимальною, враховуючи очікувану гру, спричинену стратегіями інших гравців, і переконання щодо їх типів, що маються на увазі { a j } j i . Якщо ми подивимося на межі в I1 для всіх я тоді Байеса рівновагу Неша цієї гри буде збігатися з концепцією рішення описаної Осборном.i{aj}jiai1i


i

  • Якщо гра така, яку часто грають (відміняючи питання про інші результати, які можна підтримувати в повторних іграх), ми можемо вважати Неша рівновагою в тому сенсі, що якщо ми сходимося там, ми можемо виробити норму, згідно з якою люди продовжують грати в цю рівновагу нескінченно (і розраховувати, що інші будуть робити те саме).
  • Якщо гра справді одномовна, ми зазвичай посилаємось на думку про те, що гравці намагаються передбачити, що робитимуть інші - і наше уявлення про рівновагу вкладає думку про те, що ці прогнози повинні бути правильними.

Здається, що передбачення у другому пункті відповідають "переконанням", на які посилається Осборн. Однак важливо підкреслити, що ці передбачення / "переконання" є лише неофіційним / інтуїтивним інструментом, який допомагає нам уявити, що відбувається в рівновазі, і не є частиною визначення такої рівноваги. Сама концепція рівноваги Неша є абсолютно агностичною щодо поняття переконань (як ви зазначаєте в коментарі, воно визначається лише над діями), саме тому, коли Осборн продовжує формально визначати рівновагу Неша, він робить це, не посилаючись на ідея переконань взагалі.


4

Введення віри робить концепцію NE порівнянною з іншими поняттями уточнення, такими як PBE та послідовна рівновага, але значення NE не змінюється.

Випускник мікро-підручника від Mas-Colell, Whinston and Green (MWG) має результат для цього

σΓEμ

  1. σμ HPr(H|σ)>0
  2. μσ

Таким чином, приклад дилеми в'язня, який ви наводите, де гравці мають переконання, протилежні тому, що реальна стратегія опонента не відповідає другій умові, яка вимагає, щоб переконання виходили з правила Байєса, коли це можливо. Насправді це математичний еквівалент другої вимоги визначення Осборна: про те, що переконання гравця щодо дій інших гравців є правильним.


Я думаю, що між MWG та Осборном є різниця. MWG кажуть, що для рівноваги Неша "існує" система переконань, яка робить це розумним. Ми мовчимо, які переконання, якщо такі є, гравці насправді мають. Осборн говорить, що гравці насправді мають переконання, і вони є правильними. Я подумав, що остання змінює концептуальний зміст НЕ, оскільки звичайне визначення взагалі не згадує переконання, а приклад Дилеми в'язня показує, що стратегії не визначають однозначно переконання.
Jyotirmoy Bhattacharya

@JyotirmoyBhattacharya: Я не думаю, що MWG "мовчить про те, які переконання, якщо такі є, гравці насправді мають". Умова 2 пропозиції фактично вимагає, щоб ця віра була виведена з профілю стратегії рівноваги, використовуючи правило Байєса, коли це можливо. Таким чином, у прикладі PD, коли один гравець вибирає дефект з вірогідністю 1, віра іншого гравця також повинна ставити ймовірність 1 на дефект дії та найкраще реагувати з огляду на таке переконання (що призводить до того, що він також обирає дефект).
Гер К. К.

@JyotirmoyBhattacharya: Однак віра в НЕ не повинна бути унікальною. Це тому, що якщо для заданої рівноваги шлях на дереві ігор береться з нульовою вірогідністю, то правило Байєса не застосовується, і тому будь-яка віра на цьому шляху вважатиметься "правильною" в НЕ. Ось чому вводяться уточнення, такі як послідовна рівновага, щоб виключити необгрунтовані переконання з рівноважних шляхів.
Гер К. К.

@JyotirmoyBhattacharya: Крім того, що це підручник з недооціненою освітою, Осборн, можливо, вибрав мову, більш зрозумілу, ніж математично сувору з педагогічних причин. Для мене дві умови визначення Осборна є точними аналогами у судженнях MWG.
Гер К. К.

3

Приклад дилеми вашого ув'язненого працює лише тому, що це гра з домінуючими стратегіями. Осборн правильний.

Щоб найкраще реагувати на стратегію іншого гравця, як у визначенні, яке ви даєте, я повинен знати їхню стратегію. Іншими словами, я повинен мати переконання щодо того, що вони роблять, і ці переконання повинні бути правильними. Це посилення концепції раціоналізації.

(σ,μ1)(σ,μ2)μ2σΣσiBi(σi)... "Я вважаю, що це означає, що визначення переконань є непотрібним, оскільки переконання - це точно правильна оцінка профілю стратегії. Посилання, одна з моїх книг, дає звичайне визначення із цитуванням Неша (1950), і далі йдеться про два основні припущення: одне - це правильні переконання, а інше - раціональна гра, враховуючи ці правильні переконання.


Але для спростування чогось одного зразків достатньо. Якщо ви сприймете Осборна, який стверджує, що його визначення еквівалентне тому, яке було зроблено у Неша, то як можна поводитись із контрприкладом дилеми в'язня. Я розумію, що визначення Осборна - це посилення раціоналізації, я стверджую, що це не рівновага Неша з тієї простої причини, що тут рівновага визначається над діями та переконаннями, тоді як рівновага Неша повністю мовчить про переконання.
Jyotirmoy Bhattacharya

1
Це визначення, а не доказ.
Pburg

Справедливо. Але це визначення поняття, яке вже має інше добре прийняте визначення. Тож я очікую, що якщо автор не згадує про інше, він стверджує, що два визначення є рівнозначними.
Jyotirmoy Bhattacharya

щоб було зрозуміло, він включає ці коментарі до визначення чи до дискусії? ps Я відредагував свою відповідь
Pburg

Частина, яку я цитував, - це обговорення. Відразу після цього він говорить (с.22) "Ці два компоненти втілені в наступному визначенні", а потім дає стандартне визначення з точки зору найкращого реагування на стратегії, які взагалі не згадують переконань. То де ж переконання втілені у визначенні? І проблема полягає не лише в іграх з домінуючими стратегіями. Цілком можна побудувати приклади, коли немає домінуючих стратегій, але стратегії рівноваги Неша - найкращі відповіді на переконання, відмінні від гри рівноваги.
Jyotirmoy Bhattacharya

2

Я, можливо, повторюю речі, про які говорилося раніше, але ось мій погляд на це.

Я думаю, що ми зіштовхуємось із звичайною проблемою при порівнянні двох різних моделей. Що означає "еквівалентність", не є абсолютно очевидним, оскільки два визначення лежать у різних світах або різних моделях. Однак, якщо "еквівалентність" правильно визначити, я думаю, що можна осмислити визначення Осборна і показати, що воно справді "еквівалентне" НЕ.

Концепція рішення, що лежить в основі цитованого розділу, буде приблизно такою:

sbi

ui(si | si=bi)ui(s | si=bi) for all sSi
bi=si

p

Це складна частина. Що означає, що "Кожен НЕ - це БЕ"? Звичайно, не те, що "НЕ плюс будь-який профіль переконань - це БЕ", як показав ОП із своїм протиприкладним прикладом. Тим не менш, це випадок, що "будь-який НЕ може бути зроблений BE для певного профілю віри ". Я думаю, що саме в цьому сенсі слід розуміти твердження Осборна про «еквівалентність»

Зауважте, що у нас також є наступне твердження, подібне до "еквівалентності": " Результат гри - це результат НЕ тоді і лише тоді, коли це результат BE".


Але кожен BE не є НЕ, оскільки концепція BE - це послаблення раціоналізації, яке нас суворо слабше ніж NE.
Jyotirmoy Bhattacharya

Як я вже писав, у мене виникають проблеми з розумінням того, що означає BE "не бути" НЕ, оскільки вони, здається, живуть в різних моделях. Ви маєте на увазі, що деякі стратегії, які граються в BE, не є НЕ? Я думав, що це неправильно, але я, можливо, щось пропустив. Якщо це ви маєте на увазі, чи можете ви вказати мені на зустрічний приклад? Це було б дуже корисно.
Мартін Ван дер Лінден

Я не впевнений, що BE - це послаблення раціоналізації. На моє розуміння, BE - це раціоналізація разом із умовою правильності гіпотез, правда? Якщо це правильно, то чи не будемо ми сильнішими за раціоналізаторство? (це, звичайно, може залежати від того, що називається концепцією рішення "слабкіше / сильніше")
Мартін Ван дер Лінден
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.