Чи можу я вдосконалити набір рівноваг в сигнальній грі до оптимального результату для відправника?


12

Головне питання: Я багато читав про ігри для спілкування, і мені цікаво, чи є хороші критерії для вибору між двома роздільно-ішними рівновагами. Я розглядаю поділ рівноваги як координаційну рівновагу між типами. Отже, якщо ми гарантуємо, що ці типи успішно координуються, чому б ми не дали їм узгодити для оптимального для відправника (у сенсі ефективного Парето серед відправників) рівновагу? Тобто, припустимо, існує єдина послідовна рівновага, де всі відправники роблять суворо краще, ніж у решті рівноваги. Які аргументи є для вибору цієї рівноваги?


Розглянемо наступну комунікаційну гру. Виплати одержувача - це друге число в парі. Існує шість типів відправників, причому виплати даються як перший елемент пари. Я покажу, що є рівновага басейну і принаймні два часткові розділення. Мені цікаво, які саме методики можна використовувати для аргументації на користь будь-якого поділу рівноваги. Один є оптимальним для відправника, а другий - оптимальним для приймача.

ActionBActionLActionRActionLLActionRRtypeB(0,3)(1,2)(1,2)(2,1)(2,1)typeL(0,2)(1,3)(1,2)(2,0)(2,2.25)typeR(0,2)(1,2)(1,3)(2,2.25)(2,0)typeLL(0,1)(1,2)(1,0)(2,3)(2,1)typeRR(0,1)(1,0)(1,2)(2,1)(2,3)typeH(0,0)(1,0.9)(1,0.9)(2,3.1)(2,3.1)

Нехай їх буде попередній розподіл на типи деπ

π(B)=.3,π(L)=π(R)=.2,π(LL)=π(RR)=.1,π(H)=.1.

У рівновазі пулу приймач прийме дію для очікуваної , .BEU2(B)=.3(3)+.4(2)+.2(1)=1.9EU2(L)=.3(2)+.2(3)+.2(2)+.1(2)+.1(.9)=1.89

Однак є частково відокремлювані рівноваги.

Розділення 1 Нехай типи "запитують" дії , типи і "просять" для а потім і змішують 50/50 між двома сигналами. Нехай повідомлення будуть і з природним тлумаченням.L,LLLRRRRBHlr

ТожEU2(Ll)Pr(l)=.15(2)+.2(3)+.1(2)+.025(1)=1.125=EU2(Rr)Pr(r)

Тож приймач заробляє в очікуванні. Відправникам теж краще.2.25

Розділення 2 Але розглянемо інший вид поділу. Типи і завжди надсилають повідомлення , "просячи" дії . Типи і посилають , запитуючи дії . Знову і рандомізуються рівномірно.RLLllLLLRRrrRRBH

ТодіОчікувана виплата - 1 955, оскільки кожне повідомлення надходить у половину часу.EU2(RRrr)Pr(rr)=.15(1)+.2(2.25)+.1(3)+.025(3.1)=.9775=EU2(LLll)Pr(ll).

Відповідь на з дією і з дає менший окуп, тому поділ, змішаний з об'єднанням типів і , не є корисним для прийняття "правильних" дій або як хотів би приймач.rrRllLLRRLR

Мені здається, що ця остання рівновага є більш міцною. Є дві розділюючі рівноваги, які потребують координації. Зважаючи на те, що відправники можуть координувати, чому б вони не координувались оптимальним чином для відправника?

Мені цікаво, чи існують якісь методи, які б вдосконалили набір рівноваги, щоб виключити оптимальне розділення для приймача. Можна сказати, що перша збалансованість рівноваги не є доказом неологізму.

Стійкість до неологізму визначена в розділі 3 цієї статті. Приблизно, не повинно бути додаткового повідомлення (не в дорозі) такого, що, якщо його спостерігати, одержувач може формувати переконання та раціональну стратегію, засновану на тих переконаннях, що всі, хто надіслав повідомлення, суворо краще щодо запропонованої рівноваги та тих хто не віддав перевагу запропонованому рівноважному результату. Я здогадуюсь, що тут нічого не вийде, тому що вам доведеться врахувати відразу два неологізми ( і ), щоб усунути розділення 1, яке по суті вимагає змови. Але чи є інші ідеї?llrr


Мені цікаво, як ви тут підраховуєте виплату відправника. Здається, що саме попередня виплата відправника ви використовуєте для оцінки оптимальності. Але який об’єктивний розподіл типів відправника? Це те саме, що і попереднє для приймача?
Гер К. К.

Так, ex ante. Мета така ж, як і попередня.
Пбург

Вам цікаво почути аргументи щодо фокуса, чи шукаєте ще «стандартне» вдосконалення рівноваги?
Мартін Ван дер Лінден

Переважно щось більш стандартне, але координаційні пункти також будуть вітатися.
Пбург

2
Тривіальна відповідь полягає в тому, що ви могли просто вибрати оптимальну рівновагу Парето. Багато робіт це роблять, як правило, з фразою типу "зосередження уваги на оптимальній рівновазі відправника". Виправдання є в Майлаті, Окуно-Фуджіварі та Постлейвеї (1993). Більш принциповий підхід - додавати шум, щоб кожне повідомлення надсилалося кожному типу з позитивною ймовірністю. Ймовірність близька до 1 для передбачуваного повідомлення та близько до 0 для ненавмисного. Можна взяти ймовірність помилки до нуля і використовувати граничну рівновагу як уточнення. Різна структура помилок => різна обрана рівновага.
Sander Heinsalu
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.