Вибір теми дослідження з використанням теорії ігор


19

Це нещодавнє питання теорії ігор змусило мене задуматися (це, звичайно, дотична): Чи можна ефективно оптимізувати особисту стратегію вибору дослідницьких питань для роботи з використанням теорії ігор?

Для того, щоб перейти до формалізації питання, я зроблю такі (неофіційно викладені) припущення:

  • Я однаково "насолоджуюся" будь-якою конкретною проблемою, доступною мені для роботи (щоб уникнути "м'якої" (і правильної!) Відповіді "Робіть те, що вам подобається!").
  • Я можу або не матиму успіху в пошуку відповіді на будь-яку проблему, яку я вирішу працювати. Для будь-якої заданої проблеми я маю певну оцінку ймовірності того, наскільки я буду хорошим у вирішенні проблеми (після вкладення в неї часу).
  • Моя мета - максимізувати мою виплату при оцінці вниз (подаючи заявку на роботу, претендуючи на термін перебування на посаді, подаючи заявку на стипендію тощо), що залежить від того, скільки проблем я вирішую і наскільки важливі чи важкі проблеми . У мене немає чіткого уявлення про точні виплати за проблему, але я можу зробити розумну оцінку.
  • Існує слабкий зворотний зв'язок між виплатою проблеми та труднощами проблеми. Ще одне твердження моєї мети - «розіграти» відмінності (тобто шукати «низько висячі фрукти»).
  • Екземпляр цієї загальної проблеми визначається переліком дослідницьких питань (можливо, нескінченних за кількістю), до яких я твердо додаю (без обчислювальних витрат; він подається як вхід) оцінку вартості питання та складності питання. Я граю в цю гру проти супротивника (людини, яка мене оцінює); природа вирішує, враховуючи ймовірність того, що я вирішую задану проблему, чи успішно я її вирішую після того, як вирішу спробувати її.

Прагнучи по-справжньому формалізувати те, що відбувається (і уникати нецікавих або аргументативних відповідей / відповідей типу відповідей), я розглядаю цю проблему як гру в широкій формі з неповною інформацією з нескінченним набором дій .


Питання : Я припускаю, що ігри такого типу не є ефективно обчислюваними. Однак чи існує поліноміальний алгоритм часу, щоб приблизно збільшити мою віддачу? А як щодо PTAS?

Або, як альтернатива, існує більш точна ігрово-теоретична модель цієї проблеми? Якщо так, те саме питання: Чи можу я (приблизно) максимально збільшити свою виплату? Якщо так, то як?


4
Однією з потенційних проблем при формулюванні цього як гри є те, що ваш противник, людина, яка вас оцінює, не обов'язково грає проти вас. Дійсно, часто буває, що вони на вашій стороні, і ви бажаєте бачити вас, якщо ви не пройшли мінімальний рівень вимог. Інший можливий супротивник - це всі інші дослідники , оскільки вони, можливо, співпрацюють над тією самою проблемою, і, таким чином, працюють проти того, щоб досягти успіху, намагаючись отримати результати, перш ніж робити.
Дейв Кларк

Для цілей цього питання (я хотів би пройти якомога більше обговорень, щоб це було гарним питанням ...), припустимо, що людина, що оцінює мене, дійсно знаходиться під деяким серйозним тиском, щоб вибрати одну і єдину найкращу особу для певна нагорода, тому вони є змагальними. Крім того, припустимо, що "все справді оригінальне буде саме цим: оригінальним", тому інші дослідники не викликають серйозного занепокоєння. Мене (звичайно!) Особисто цікавлять інші можливості, але я думаю, що залишити це відкритим буде запрошувати погані відповіді. :)
Даніель Апон

Один фактор проблеми, який може заслуговувати на іншу модель: Оцінка ймовірності успіху / структури винагороди за проблему, над якою я вирішу працювати.
Даніель Апон

2
RTriPi(t)t

2
Звичайно, в реальному житті кожне запитання, на яке ви відповідаєте, розблоковує більше запитань, які ви не можете передбачити заздалегідь, але які, можливо, простіші та / або варті більше, ніж набір питань, з яких ви почали, але як тільки ви почнете створювати дерева стратегій як це, шанс знайти щось цікаве, що ви можете сказати про гру, різко знижується.
Пітер Шор

Відповіді:


4

Я спробую відповісти на ваше запитання, запропонувавши альтернативну модель для запитання. Я зазвичай задаю більше запитань, ніж я тут відповідаю, тому сподіваюсь, що ви простите, якщо моя відповідь не буде оптимальною, хоча я роблю все можливе.

Я думаю, що спосіб постановки питання, який був би оптимальним для того, щоб теорія ігор була корисною, полягала б у прийнятті більш конкурентоспроможного сценарію. Тобто, має бути конкуренція між різними акторами. Отже, я припускаю наступне:

  • Існує велика, але обмежена кількість n інших дослідників, які намагаються здійснити той самий набір доступних дослідницьких питань, які я називаю Q , які вас цікавлять.
  • Кожна дослідницька проблема визначається такими характеристиками:
    • Вкладення часу , або я , необхідне для досягнення наочності щодо того, чи зможете ви вирішити проблему чи ні
    • Ймовірність успіху або S при вирішенні проблеми; як тільки ви досягнете "моменту істини" і вкладете достатньо часу, Природа вирішить випадковим чином, чи зможете ви вирішити проблему чи ні
    • Користь у вашій кар'єрі , або U (як у корисності), за умови досягнення успіху
  • Кожен з цих дослідників має різні рівні наступних кількостей:
    • Час, доступний для інвестицій у дослідження, т
    • Талант у дослідженні, r
    • Міжособистісні навички та інші якості сприяння кар’єрі, л (як на привабливість), що визначає, наскільки добре дослідник буде використовувати свої успіхи в дослідженні для просування в кар'єрі

Тепер, якщо припустити, що співпраця з будь-якої проблеми неможлива, розгляньте, що я буду називати "динамічною ітераційною грою". Це гра, яка грається неодноразово, але яка дещо змінюється щоразу, коли вона грається.

Нехай M - кількість ходів або поворотів у грі. Початковий прояв гри може бути представлений як список, який містить кожного актора (дослідника) та кожну проблему, над якою він міг би працювати, окрім усіх значень, пов’язаних з кожним актором, та кожної проблеми, яку я перелічив вище. (Я, звичайно, припускаю, що кожен дослідник знає все відоме на сьогоднішній день про всі проблеми та про всіх інших дослідників, роблячи це грою досконалої інформації.)

Під час кожної ітерації гри даний актор вибирає дослідницьке питання, над яким буде працювати. Кожному актору дозволено перемикати питання в будь-який час, і якщо проблема вирішена, користь для кар'єри U знижується до 0 для всіх інших гравців. Якщо гравець вкладає достатньо часу і не в змозі вирішити проблему, то цьому конкретному гравцеві забороняється знову намагатися вирішити цю проблему ... хоча будь-якому іншому гравцеві дозволено продовжувати роботу над проблемою, і інший актор може мати змогу вирішити проблему це успішно. Гра закінчується після того, як були зроблені всі М оборотів.

Кожен поворот, який дослідник обрав проблему, призведе до того, що гравець наблизиться до досягнення "моменту істини" і, можливо, до вирішення проблеми, дозволяючи природі. Проблема, щойно вирішена, додає певної користі кар'єрі дослідника на основі l . Дослідницький талант посилює ймовірність успіху, тоді як вільний час посилює здатність до досягнення прогресу за певну чергу.

Сумніваюсь, що існує якийсь поліноміальний алгоритм часу для вирішення цього питання; Я не бачу жодної причини, чому дослідників слід обмежувати грати в рівнобійну чисту стратегію Неша, тому проблема передбачає змішану стратегію рівноваги Неша і, таким чином, є в гіршому випадку ППАД, якщо вважати, що "вирішення проблеми" означає "пошук Неша" рівновага для проблеми ". (Можна було б уявити, що якщо ви найактивніший дослідник навколо, ви можете піти вперед і обчислити свою улюблену рівновагу Неша, а потім подати сигнал усім іншим гравцям ... тим самим надаючи вам певної впевненості, що ніхто не змінить стратегії подалі від стратегії профіль, на який ви сигналізували.)

У будь-якому випадку, це найбільше відповідь, яку я коли-небудь публікував. Я сподіваюся, що це має хоч якусь цінність. Будь ласка, дайте мені знати, чи є хто-небудь відповідь на нього або рекомендації щодо його вдосконалення.


1
Філіп, дякую за відповідь! Це чудовий погляд на проблему; Цікаво: Чи можете ви придумати будь-який спосіб додати поняття "часткової інформації" в проблему, щоб вона зберігала свій статус повноти PPAD? Щось моделює той факт, що, будучи гравцем у цій грі, я не обов'язково знаю, чим займаються всі мої супротивники (тобто я не маю досконалих знань щодо питань, які вони розглядають, і якої сили вони вважають у них відповідаючи на кожне запитання)? Чи впливає додавання цього на складність обчислення рівноваги Неша? (Я не знаю!)
Даніель Апон

1
@Daniel Apon: Дякую за коментар! Я не думаю, що буде складно змінити умови, щоб ви просто не знали, що роблять ваші супротивники, або які їх характеристики. Єдине застереження - я думаю, що гарантія існування рівноваги Неша зникає, коли ви маєте справу з недосконалою інформаційною грою. Я не знаю дуже багато про те, що називають "Стаккельберзькими іграми", але я думаю, що вони можуть відповідати запропонованій вами зміні. Я насправді замислювався над тим, яка найкраща концепція рішення полягає в недосконалих інформаційних іграх ... Я подумаю.
Філіп Уайт

Я читаю трохи більше про це ... Я думаю, що ігри Байєса тут можуть бути актуальними, оскільки вони використовуються для боротьби з іграми з недосконалою інформацією. Ось посилання на сторінку Вікіпедії, яку я переглянув: en.wikipedia.org/wiki/Bayesian_game
Філіп Уайт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.