Джерела алгоритмічної еволюційної теорії ігор


15

Я вживаю найменування терміна в дуже пухкому сенсі.

Проводиться значна робота над теорією еволюційних ігор, включаючи її математичні основи. Мені було рекомендовано "Еволюційні ігри та динаміка населення", але я ще не заглиблювався в неї.

Також є значна кількість роботи над алгоритмічною теорією ігор, яка є популярною темою на цьому сайті.

Що я хотів би побачити, це робота, яка складає обчислювальну складність або конвергенцію тверджень про певну еволюційну динаміку.

Приклади (фразовані дуже вільно):

  1. Враховуючи чисельність населення та еволюційну схему, чи можемо ми дати імовірнісний жаль, що пов'язаний з довгостроковою оптимальністю населення (порівняно з найкращим виробником?). Це, здається, сильно стосується ансамблів експертів і проблем з бандитами. А як щодо нестаціонарних налаштувань?
  2. Враховуючи сукупність популяцій різних видів, які взаємодіють у їхньому середовищі, граючи майже будь-яку гру з різними гравцями, які заяви ми можемо зробити про можливу стабільність їх стратегій чи розподілу стратегій, враховуючи їх еволюційні стратегії.
  3. У будь-якому середовищі з багатьма «нішами» (я розумію, що це загальний спосіб їх фразування), чи то з точки зору прямого зв’язку з навколишнім середовищем, чи з точки зору стосунків з іншими видами, які твердження ми можемо зробити про те, як поширюватимуться популяції через ці ніші.
  4. Будь-яка проблема, яку я не запитував, але повинен - ​​я стикаюся з цим з невеликими AGT, TCS, генетичними алгоритмами, теорією еволюційних ігор чи фоном біології населення; Я задаю свої питання з точки зору оптимізації / машинного навчання / статистики, що може бути неправильним або неповним.

Відповіді:


11

Це одна з тем, де я деякий час шукав зв’язків. Однак вони не здаються усіма поширеними. Люди, які працюють над теоретичною біологією та економікою, які використовують EGT, зазвичай дотримуються теорії динамічних систем і не наділяють алгоритмічну лінзу. Таким чином, більшість результатів мають стиль AMath / Physics, а не алгоритми та дискретний математичний стиль. Якщо ви готові дотримуватися динамічного системного підходу, то там опитування Гофбауера та Зігмунда є коротшим та останнім, ніж їхня книга (я згадую про це та деякі коментарі, що передаються у попередній відповіді ).

Одне з місць динаміки реплікаторів було використано в результатах, пов'язаних зі складністю, - Марчелло Пелілло та співавтори як евристичний для вирішення максимуму кліки (зменшити максимальну кліку до квадратичного програмування, вирішити квадратичне програмування, використовуючи динаміку реплікатора як евристичний) :

[1] Іммануель М. Бомзе та Марчелло Пелілло [2000]. "Наближення максимальної ваги за допомогою динаміки реплікатора." Операції IEEE в нейронних мережах 11 (6)

[2] Марчелло Пелілло та Андреа Торселло [2006]. "Монотонна динаміка ігор та максимальна проблема". Нейрові обчислення 18: 1215-1258.

Σ2ПΣ2П

[3] Куша Етессамі та Андреас Лохбілер [2008] "Обчислювальна складність еволюційно стійких стратегій". Міжнародний журнал теорії ігор , 37 (1): 93-113. (Вперше доступний у 2004 році як технічний звіт ECCC TR04-055).

[4] Вінсент Конзіцер [2013] "Точна обчислювальна складність еволюційно стабільних стратегій". 9-я конференція з питань Інтернет та Інтернет-економіки (WINE) . ( pdf ).

Сьогодні багато цікавих запитань щодо EGT стосуються ігор на графіках, і хоча є деякі цікаві результати динамічної системи, наприклад (див. Також це питання для розширень цього підходу):

[5] Хісаші Оццукі та Мартін Новак [2006] "Рівняння реплікатора на графах". _ Журнал теоретичної біології_, 243 (1), 86-97 ( посилання , допис у блозі )

Більшість робіт проходить через моделювання на основі агентів (див. Цю відповідь для контексту моделювання поширення хвороби). Ці моделі, як правило, набагато привітають складності та конвергенцію. Подивіться наступну книгу для отримання додаткової інформації:

[6] Йоав Шохам та Кевін Лейтон-Браун [2009], "Багатоагентні системи: алгоритмічні, ігрово-теоретичні та логічні основи", Кембриджський університетський прес.

Я думаю, що машинне навчання є досить простим способом наблизитись до EGT, оскільки це природний півдорога між відповідною фізикою (статистична механіка) та інформатикою. Це, безумовно, було зроблено, мені знадобиться трохи знайти хороший довідник, але випадкова посилання (яка також показує, що люди з EGT розглядали інші популярні концепції рівноваги, як-от корельована рівновага):

[7] Сергіу Харт та Андреу Мас-Коллл [2000], "Проста адаптивна процедура, що веде до корельованої рівноваги", Економетрика 68 (5): 1127-1150

[8] Антонелла Іанні [2001], "Навчання корельованих рівноваг у популяційних іграх", Математичні соціальні науки 42 (3): 271-294.

[9] Людек Циглер та Бой Фалтінг [2011], "Досягнення корельованих рівноваг через багатоагентне навчання", AAMAS 2011: 509-516

Я, безумовно, сподіваюся, що інші дадуть більш конкретні відповіді, оскільки це питання, про яке я завжди хотів дізнатися більше.


5

Як казали інші, є менше, ніж ви могли б очікувати. Кілька дотично пов'язаних паперів:

"Мультиплікативні ваги в іграх координації та теорія еволюції" Чейстена, Лівната, Пападімітріу та Вазірані. У цій роботі стверджується, що еволюційна динаміка (у простій моделі) еквівалентна грі координації між генами, що граються за допомогою алгоритму навчання мультиплікативних ваг. Вони аналізують 2 генний варіант у спрощеній моделі.

Зауважте, що алгоритм мультиплікативного вагу - це природна динаміка, яка, як відомо, переходить до рівноваги Неша в іграх з нульовою сумою, іграх з неотомічним потенціалом та деяких інших (див., Наприклад, Freund та Schapire )

"Ціна стохастичної анархії" Чунга, Лігетта, Пруха та мене (з певного часу). Тут ми вивчаємо стохастично стійкі стани гри, пов'язані з ESS. Ми не турбуємось про складність їх пошуку, але ми показуємо, що в деяких іграх ціна анархії нижча за набір стохастично стійких рівноваг порівняно з довільною рівновагою Неша.


-1

Я дізнався у школі Ешлока . Я отримав великий відбір, наскільки корисним було взятин2 таблиця результатів між агентами та використовувати K-засоби для розподілу рядків у групи стратегій для аналізу.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.