Що насправді Баттігаллі означає "Гравці не можуть вибирати стратегії, вони можуть обирати лише дії".

У цьому відео (з 7: 30 до 9: 00) на Youtube Баттігаллі згадує про стан світу для простої триноги гри зі стоножкою, яка, власним словом, є

" опис всього важливого, що в традиційній теорії повинно включати стратегії, що характеризують Енн і Боба. Я не використовую слово" Енн вибирає стратегію ". Причина дуже проста. Об'єктом вибору є дія, Гравці не можуть вибирати стратегії, вони можуть вибирати тільки дії. Якщо Енн може вибирати стратегії , вони грають в іншу гру ". $\ldots$ $(C, C^\prime)$

Що насправді означає Pierpaolo Battigalli? Якщо дії для гравця, які вибирає, були визначені, то він автоматично визначає чисту стратегію. За цією методологією він, схоже, хоче розрізнити структуру гри з прихильністю та без гри, але як?

Додано: Ось слайди, використані у відео, і ось відповідний папір.

game-theory dynamic-games

— Metta World Peace
джерело

Ідея саме , що гравці не вибрали дії S , але тільки вибрали одну дію в той час на кожен вузол , на якому вони грають, на основі своїх уявлень про шляхи інших гравців і самі будуть грати на майбутніх вузлах в грі (де переконання залежать від історії, яка вела до цього вузла).

Інтерпретація дозволяє гравцям вибирати повноцінні стратегії, рівнозначні дозволу гравцям розраховувати на комп'ютерну програму, щоб грати в гру замість них. Тобто вони можуть скористатися через цю комп'ютерну програму для відтворення заданої дії на кожному вузлі.

Такі ігри з пристроями, що займаються зобов'язаннями, по суті сильно відрізняються від ігор, у яких фактичні гравці повинні неодноразово обирати дію на кожному з вузлів прийняття рішень. Коли фактичні гравці грають у вузлах, гравці повинні формувати уявлення про те, як будуть грати інші гравці та самі на майбутніх вузлах, і ці переконання можуть залежати від історії, що призвела до майбутніх вузлів .

Наприклад, у грі Штакельберга лідер може вірити, що послідовник буде раціональним (тобто, максимізація корисності), якщо лідер гратиме у "Низькому виробництві", але буде ірраціональним (тобто, не корисністю максимізації), якщо лідер гратиме "Високо виробництво ". Можливо, ведучий передбачає, що послідовник розсердиться, якщо ведучий зіграє "Високу продукцію", і що, засліплений її гнівом, послідовник потім захоче помститися.

Якби послідовник міг дотримуватися стратегії, гра була б зовсім іншою. Можливо, послідовник міг би зобов'язаний не помститися до того, як вона злиться, і вона вже не може допомогти своєму бажанню помститися. Але тут ідея полягає в тому, що фактичний послідовник повинен вибрати дію пізніше в грі, враховуючи те, що обрав лідер у кореневому вузлі. Отже, поведінкове правило, за допомогою якого підписник вибирає дію на вузлі (наприклад, утиліта max проти не корисності max), а переконання лідера щодо цих процедур можуть залежати також від історії, яка вела до цього вузла.

Це відкриває шлях для багатьох нових результатів гри, які б не вийшли з класичної теорії ігор. З концептуальної точки зору він також перемикає фокус від концепції рішення до епістемічного та поведінкового припущення (тобто, від класичної теорії ігор до теорії епістемічних ігор). Замість визначення набору розумних результатів (наприклад, результатів рівноваги Неша) та перегляду стратегій, які відповідають цим результатам, можна визначити розумні властивості поведінки та переконань гравців (про переконання та поведінку інших) та дійти висновків ці епістемічні та поведінкові припущення щодо результату в міру розвитку гри .

Тепер це просто для того, щоб дати трохи м'яса та інтуїції рамкам Баттіґаллі, і це не справедливо для багатства рамки (частково тому, що я не знаю багато про його роботу, окрім цього відео, яке ви пов’язали). Якщо ви цього ще не зробили, я настійно рекомендую переглянути все відео. Я думаю, що Баттігаллі робить велику роботу, роблячи доступ до його рамки. Він також наводить корисні та інтуїтивні приклади, щоб пов’язати свій епістемічний підхід до "класичної" теорії ігор шляхом виявлення простих умов переконань та поведінки гравців, які дозволяють відновити класичні рішення для таких ігор, як індукція назад.

— Мартін Ван дер Лінден
джерело

Дякую за вашу відповідь, що дуже корисно. Мені здається, ваше тлумачення принципу Баттіґаллі, тобто вибір дій, а не стратегій, є рівнозначним його динамічній системі переконань, переконанням, що обумовлюється умовними переконаннями, а не вірою в стратегії, а також, здається, ви посилаєтесь на його результат, його динамічну віру система і тверда віра в раціональність, що передбачає зворотну індукцію, що є більш привабливим, ніж загальне знання про раціональність Амана, що передбачає зворотну індукцію.

— Світовий мир Метта

Проблема полягає в тому, що ці речі були розроблені Баттіґаллі та його співавторами більше десяти років тому. Але ця лекція стосується його роботи у 2013 році. Що нового?

— Світовий мир Метта

"Якщо ви цього ще не зробили, я настійно рекомендую переглянути все відео". Фраза "настійно рекомендую" схожа на "сильно вірю", як придумана Баттігаллі, правда? :)

— Метта світ у

@MettaWorldPeace: Я не знав про роботу Баттіґаллі перед переглядом відео, тому я не міг сказати, чи є в ньому щось нове, чи він просто давав вступ до роботи, яку він розробив за останнє десятиліття.

— Мартін Ван дер Лінден