Оптимальні випадкові ставки


7

Це питання виникає з цього веб-сайту, який я часто переглядаю.

Два гравці продовжують горяче нове ігрове шоу під назвою "Виграє більша кількість". Двоє йдуть в окремі кабінки, і кожен натискає кнопку, і на екрані з'являється випадкове число між нулем і одним. (У цей момент жоден номер другого не знає, але вони знають, що числа вибираються зі стандартного рівномірного розподілу.) Вони можуть вибрати, щоб зберегти це перше число, або знову натиснути кнопку, щоб відкинути перше число та отримати друге випадкове число, яке вони повинні зберігати. Потім вони виходять зі своїх кабінок і бачать підсумковий номер кожного гравця на стіні. Розкішний головний приз - справа, повна золотих злитків - присуджується гравцеві, який утримав більшу кількість. Яке число є оптимальним обмеженням для гравців, щоб зняти своє перше число та вибрати інше? Поставте інший спосіб, в межах якого діапазону вони повинні вибрати, щоб зберегти перший номер,

Це або дуже дивна проблема аукціону з симетричними гравцями (я також припускаю, що гравці є нейтральними до ризику), або дуже дивна лотерея / теорія ігор.

Як би ви підходили до цього питання математично кажучи і яку відповідь ви отримуєте на нього? Немає премії за те, щоб отримати правильну відповідь на загадку сайту, мені просто цікаво. Моя інтуїція підказує мені, що оптимальне обмеження становить 0,5, оскільки у вас є 50-50 шансів бути вищим чи нижчим за число опонента, незалежно від того, чи він / вона повторює їх випадкове число чи ні, але я не впевнений.


Я не думаю, що нейтралітет ризику не має нічого спільного з цим, гравці просто намагаються максимально збільшити свою ймовірність виграти. Виплати є двійковими, безпечних середніх результатів немає.
Giskard

@denesp Ви можете ризикувати проти того, що якби намалювати 0,46, ви, можливо, не захочете перемальовуватись, хоча у вас є більше шансів отримати кращу кількість, ніж гіршу.
Кітсуне Кіннота

1
@KitsuneCavalry Я бачу, що ви говорите, але це було б якесь "поведінкове" поняття відрази від ризику, оскільки воно визначене на проміжному кроці, а не на кінцевих результатах.
Шейн

@Shane Звичайно, я чую. І я все одно не надто переживаю з цього приводу.
Кітсуне Кіннота

Відповіді:


6

Спочатку я просто покажу, що 0,5 (або 12) точка відсічення не працює як симетрична рівновага, тоді ви можете вирішити для себе, чи хочете ви подумати над проблемою або прочитати повну відповідь.

Позначимо точки відсічення через cx,cy. Припустимо, обидва гравці використовують стратегіюc=12. Позначимо числа гравцяx і y відповідно від x1 і y1 і їх потенційне друге число по x2 і y2. Припустимоx1=23. Зберігаючи це ймовірність того, що гравецьx перемагає

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
Це також означає, що 23є медіаною цього розподілу .

Тепер припустимо x1=12. Зберігаючи це ймовірність того, що гравецьx перемагає

P(y1<12)P(y2<12)=1212=14
Але якщо він відкине x1=12 у нього є ймовірність
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
перемоги. 38>14 так зберігаючи x1=12 (та його оточення) не є оптимальним, тому не може бути рухом рівноваги.


СПОЙЛЕР ПОПЕРЕДЖЕННЯ

Якщо гравець y має відсічку cy та гравець x малює x1=cy і зберігає його ймовірність того, що гравець x перемагає

P(y1<cy)P(y2<cy)=cycy=cy2.
Якщо гравець x куди відкинути x1 ймовірність того, що він виграє, є
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
Припустимо, існує симетрична рівновага, тобто cx=cy=c.
(Я не думаю, що інші рівноваги існують, але я цього не довів.)
Оскільки ймовірність виграти є величиною безперервноїx1, граничне значення c таке, що якщо x1=c то ймовірність виграшу дорівнює, коли x1зберігається і коли він викидається. Це означає що
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.


Хтось зробив подібне виведення, як ви, і зробив цей розрахунок Вольфрама, щоб перевірити його ще раз: tinyurl.com/j9xey5t Тож я йду вперед і скажу, що це виглядає правильно. Тепер, якщо ви вирішите загальну форму цієї гри, я дам вам найкращу відповідь: P Kidding ~ (Хоча було б цікаво подивитися, як гра змінюється з більшою кількістю шансів на перемотування.) Чи означає, що ваш відредагований відрізок означає, що обидва гравці мають 50 % виграшу, чи ти все ще вважаєш помилку у своїй відповіді?
Кітсун Кіннота

@KitsuneCavalry Я думаю, що прийняти це було трохи передчасно, але, на щастя, розрахунок правильний, і мої міркування про 50% були помилковими. Відрізок настільки високий, що малювання йому "пощастило", і тим самим у вас є більше 50% шансів на виграш, якщо ви його намалюєте. Перед жеребкуванням у вас рівно 50%.
Giskard

Якщо він рахує щось, сайт, який дав питання, дав відповідь. Ви отримали це на гроші. Відчуйте себе переможцем сьогодні. Ви заробили це B)
Кітсун Кіннота

2

Припустимо, людина 1 обирає обріз c1 і людина 2 вибирає обріз c2, с c2c1. Дозволяєp1(x) бути ймовірністю того, що остаточне число особи 1 не більше x. p1(x) дорівнює c1x якщо x<c1 і c1x+xc1інакше. Визначтеp2(x)аналогічно. Тепер сюжетp2(x) проти p1(x) на параметричній ділянці для 0x1. Результат - три рядкові сегменти:

  • Один із (0,0) до (c12,c1c2), відповідна 0xc1;
  • Один із (c12,c1c2) до (c1c2+c2c1,c22), відповідна c1xc2;
  • Один із (c1c2+c2c1,c22) до (1,1), відповідна c2x1.

Ці три рядкові сегменти ділять одиничний квадрат на дві частини. Площа частини під графіком - це ймовірність того, що людина 1 має більшу кількість. Деяка геометрія показує, що ця область є12+12(c2c1)(c1c2+c21). Щоб існувала стабільна рівновага, обидві часткові похідні цього повинні бути нульовими, тобто

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

Додавання рівнянь показує, що (c2c1)(1+c1+c2)=0, що можливо лише в тому випадку, якщо c1=c2. Підставивши назад до одного з рівнянь,1c1c12=0, отже, єдина стабільна рівновага c1=c2=512.


Це чудова відповідь, але чому ви називаєте рівновагу стабільною рівновагою?
Giskard

1
@denesp Я думаю, що це зайве.
f ''
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.