Конверт Парадокс


8

Є два конверти. Один міститьx гроші, а інше містить 2xкількість грошей. Точна сума "x"мені невідомо, але я знаю вище. Я вибираю один конверт і відкриваю його. Бачу y гроші в ньому, очевидно, де y{x,2x}.

Тепер мені пропонують зберігати або перемикати конверти.

Очікуване значення перемикання - (122y+1212y)=54y. Очікувана цінність зберігання мого конверта -y.

Здається, я завжди повинен перемикати конверти. Мої два питання:

Чи правильно це міркування?

Чи інакше, якщо мені не дозволяють відкривати конверт і бачити y кількість грошей, і тоді мені надається можливість переключитися на невизначений термін?



1
Ви не можете просто взяти на себе очікування, ви повинні почати з переконань про х і оновити свої переконання відповідно до правила Байєса. Як тільки ви побачите y, ваші переконання щодо того, який конверт ви відкрили, зміниться.
HRSE

Скажімо, х рівномірно розподілено між 0 і . Тоді що?
Кітсун Кіннота

@KitsuneCavalry Немає такого розподілу. (Будь ласка, надішліть мені програму, що генерує такий розподіл.) Насправді немає жодної резолюції, яка б формувала переконання pior, наведені у вашому запитанні, для всіх значеньy. У посиланні Герр К. це пояснюється в en.wikipedia.org/wiki/…
Giskard

3
@Kitsune Cavalry Рівномірний розподіл по половині лінії (або по всій лінії) є добре відомим неадекватним попереднім байєсівською статистикою, дивіться на смак stats.stackexchange.com/a/97790/28746 або stats.stackexchange.com/a/ 35794/28746
Алекос Пападопулос

Відповіді:


5

Ось "очікуваний корисний максимізація / теоретичний ігровий процес" до цього питання (з дефісом теоретично заданої теорії). У таких рамках відповіді видаються чіткими.

ПРЕМІСТИ

Нам з абсолютною чесністю говорять, що, бо x суворо позитивна грошова сума, два бокси були розміщені у коробці: {A=x,B=2x} з присвоєним ідентифікаційним номером 1 і {A=2x,B=x} з присвоєним ідентифікаційним номером 0. Потім нічия від Бернуллі (p=0.5) було виконано випадкову змінну, і на основі результату та події, що сталася, сум x і 2x були поміщені в конверти A і B. Нам не кажуть, у чому цінністьx є, або яка сума пішла на який конверт.

Перший випадок: виберіть конверт із можливістю перемикатися, не відкриваючи його

Перше питання - як вибрати конверт ? Це стосується переваг. Тож припустимо, що від нас очікують максимізатори корисних функцій з функцією корисностіu().

Тут можна моделювати ймовірнісну структуру, розглядаючи дві дихотомічні випадкові величини, A і Bщо представляють конверти та кількість в них. Підтримка кожного є{x,2x}. Але вони не є незалежними. Тому ми повинні почати із спільного розподілу. У таблиці таблиці - спільний розподіл та відповідні граничні розподіли

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Це нам говорить про це A і B мають однакові граничні розподіли.

Але це означає, що не важливо, як ми обираємо конверти, адже ми завжди отримаємо ту ж очікувану корисність ,

0.5u(x)+0.5u(2x)

З чим ми стикаємося тут - складна гра (як вибрати конверт) над двома однаковими азартами (кожен конверт). Ми можемо вибратиA з вірогідністю 1, 0або що-небудь середнє (та взаємодоповнююче для B). Це не має значення. Ми завжди отримаємо ту ж очікувану утиліту. Зауважте, наше ставлення до ризику тут не грає ролі.

Тож ми вибираємо конверт, скажімо A, і ми на це дивимось. Яка зараз наша очікувана корисність? Точно так само, як і до вибору . Вибір конверта будь-яким способом не впливає на ймовірність того, що знаходиться всередині.

Нам дозволяється перемикатися. Скажімо, ми це робимо, і зараз ми тримаємо конвертB. На що зараз очікується корисність? Точно так само, як і раніше .

Для нас це два можливі стани світу: обирайте A або вибрати B. За будь-якого вибору обидва держави світу мають однакове значення для нашої обраної / прийнятої рушійної сили (тобто максимізувати очікувану корисність).

Тож тут ми байдужі до переключення. і насправді ми могли б також рандомізувати.

2-й СПРАВКА: ВІДКРИТТЕ ЕНЕРВЮ з можливістю перемикатися після

Припустимо, що ми вибрали A, відкрив його і знайшов усередині суму y{x,2x}. Чи це змінює речі?

Подивимось. Цікаво, що таке

P(A=xA{x,2x})=?

Добре, {x,2x} - вибірковий простір, на якому випадкова величина Aвизначено. Кондиціонування всього простору вибірки, тобто тривіальної сигма-алгебри, не впливає ні на ймовірності, ні на очікувані значення. Ніби ми не задаємося питанням "у чому цінність"A якщо ми знаємо, що всі можливі значення можуть бути реалізовані? "Ефективних знань не отримано, тож ми все ще перебуваємо на початковій ймовірнісній структурі.

Але мені також цікаво, що таке

P(B=xA{x,2x})=?

Заява про кондиціювання, належним чином розглядається як сигма-алгебра, породжена подією {A{x,2x}}, являє собою весь пробний простір продукту, на якому знаходиться випадковий вектор (A,B)було визначено. З наведеної вище таблиці спільного розподілу ми бачимо, що розподіл ймовірностей суглоба рівнозначний розподілу ймовірностей маргіналів (кваліфікація "майже достовірно" через наявність двох подій міри нуля). Тож і тут ми суттєво обумовлюємо ймовірностіBна весь простий простір. Звідси випливає, що наша дія щодо відкриття конверта не вплинула на ймовірнісну структуру дляB також.

Введіть теорію ігор разом з прийняттям рішень. Ми відкрили конверт, і ми маємо вирішити, переключимось чи ні. Якщо ми не переходимо, ми отримуємо корисністьu(y). Якщо ми переходимо, то ми перебуваємо в наступних двох можливих станах світу

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

Ми не знаємо, який стан насправді має місце, але згідно з вищезгаданою дискусією ми знаємо, що кожен має ймовірність p=0.5 існуючих.

Ми можемо моделювати це як гру, де наш опонент - «природа» і де ми знаємо, що природа з певністю грає у рандомізовану стратегію :p=0.5 y=x і с p=0.5, y=2x. Але ми також тепер, що якщо ми не переходимо, наша виплата певна. Тож ось наша гра в нормальному вигляді з нашими виплатами:

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

Ми повинні протистояти спокусі замінити u(x) і u(2x) для u(y). u(y)- відома і певна виплата. Виплати за стратегію "Switch" насправді не відомі (оскільки ми не знаємо значенняx). Тож нам слід змінити заміну . Якщоy=x тоді u(2x)=u(2y), і якщо y=2x тоді u(x)=u(y/2). Тож ось наша гра знову:

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

Тепер відомі всі виплати в матриці. Чи є чиста домінуюча стратегія?

Очікувана виплата стратегії "Switch" така

E(VS)=0.5u(2y)+0.5u(y/2)

Очікувана виплата стратегії "Не перемикатися" є

E(VDS)=u(y)

Ми повинні перейти, якщо

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

І тепер ставлення до ризику стає критичним. Не важко зробити висновок, що за ризикованої та ризикованої нейтральної поведінки нам слід переключитися.

Що стосується поведінки , що запобігає ризику , я вважаю елегантний результат:

Для "менш увігнутих" (суворо вище) функцій корисності, ніж логарифмічні (скажімо, квадратний корінь), тоді нам слід переключитися.

Для логарифмічної корисності u(y)=lny, ми байдужі між перемиканням чи ні.

Для "більш увігнутих", ніж (суворо нижче) логарифмічних функцій корисності, ми не повинні перемикатися.

Закриваю схемою логарифмічного випадку

введіть тут опис зображення

Припустимо y=4. Тодіy/2=2,2y=8. ЛініяΓΔΕ- це лінія, на якій буде лежати очікувана утиліта від "Switch". Оскільки природа грає на5050 стратегія, це насправді буде в курсі Δ, яка є середньою точкою ΓΔΕ. У цей момент за допомогою логарифмічної утиліти ми отримуємо абсолютно таку ж утиліту від "Не перемикатися", тобтоln(4) для цього числового прикладу.


Викликання "відмови від ризику" через логарифмічну функцію корисності не вирішує парадокс. Як зазначає @HRSE, використовуючи теорему Байєса, ймовірність того, що виплати єu(2y) і u(y/2не становлять 0,5 після того, як побачили суму в першому конверті. Це було б справедливим лише для дуже сумнівних рівномірних неналежних до початкуx (для x>0). Якщо ви користуєтесь належним попереднім ввімкнx (відображаючи переконання про x), рішення стає для переключення, якщо y достатньо малий і зберігати перший конверт, якщо yдосить великий. Див. Jstor.org/stable/2685310 .
Jarle Tufto

@JarleTufto Як я це бачу, уніформа є правильним попереднім, якщо хтось вирішить повірити організаторам гри, коли вони кажуть, що грошові суми були поміщені в конверти після розіграшу Бернуллі з p=0.5. Якщо хтось хоче бути підозрілим, не вірити організаторам і формувати якусь іншу попередню віру, це, звичайно, його право, але йому доведеться прийти з деяким аргументом, щоб переконати мене в тому, що: а) чому організатори брешуть і б) як чи він обирає різні, які він вибирає. Зауважте, що моя відповідь передбачає, що ми віримо організаторам з цього питання.
Алекос Пападопулос

Я, звичайно, погоджуюся, що вам видають кожен конверт, що містить суми X і 2Xвідповідно з рівними ймовірностями 1/2. Я говорю, що неявна неправильна уніформа доX яку ви використовуєте, тобто π(x)=1, для усіх x>0 призводить до парадоксу, оскільки теорема Байєса приводить до P(X=y|Y=y)=P(X=y/2|Y=y)=1/2 де y- спостережувана кількість у першому конверті. Використання належного попередньогоπ(x) натомість ці умовні ймовірності різняться і залежить оптимальне рішення y(і звичайно функція корисності).
Jarle Tufto

@JarleTufto Це неправильне попереднє згадування, воно відображає ймовірності, пов’язані з чим?
Алекос Пападопулос

Сума грошей у двох конвертах є X і 2X. Попередній розподіл ймовірностей відображає ваші переконання щодоXперед відкриттям будь-якого конверта. Ви або неявно використовуєте цей конкретний раніше, або ви вчиняєте помилку рівняння зворотних умовних ймовірностей.
Jarle Tufto

0

Якщо ви відкриєте конверт E1 і бачите, що його значення E1 = Y , то вірно, що значення іншої оболонки E2 знаходиться в {E2 = Y / 2, E2 = 2Y} .

Вірно також, що очікуване значення цього конверта становить (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

Помилка в припущенні , що Рг (Е2 = Y / 2) = Pr (Е2 = 2Y) = 1/2 , незалежно від того, що Y є. Спрощеним способом показати це - припустити, що кожен конверт містить паперові гроші США різних номіналів. Якщо Y = $ 1 , то E2 не може бути Y / 2 .

Більш суворий доказ є надто детальним, щоб навести тут, але його підсумок спочатку передбачає, що для будь-якого значення Z , що Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Це по суті те саме припущення, що і в останньому абзаці, розширене до діапазону значень. Але якщо це справедливо для будь-якого значення Z , це означає, що Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) є постійним для кожного значення N , від -inf до інф. Оскільки це неможливо, припущення не може бути правильним.

+++++

Це, можливо, було трохи заплутано, тому дозвольте спробувати приклад. Вам дають два набори з двох конвертів. В одному наборі вони містять 10 та 20 доларів. В іншому вони містять 20 і 40. Ви вибираєте набір, а потім відкриваєте один конверт у цьому наборі, щоб знайти 20. Тоді вам пропонується можливість перейти на інший конверт у цьому наборі. Ви повинні?

Так, слід переключитися. Очікуване посилення при переході на інший конверт - [(20-10) + (20-40)] / 2 = +5.

Зауважте, що цей екземпляр - тобто знаючи, що ви знайшли 20, а не 10 чи 40, відповідає умовам, які ви описуєте у своєму запитанні. Отже, ваше рішення працює. Але сам експеримент не відповідає цьому опису. Якщо ви знайшли 10, або якщо ви знайшли 40, ймовірність іншого конверта становить 20 - це 100%. Очікувані прибутки становлять +10 та -20 відповідно. І якщо в середньому три можливі вигоди від ймовірностей ви отримаєте три значення, ви отримаєте 10/4 + 5/2 - 20/4 = 0.


Чому я вважаю, що конверт не може мати 50 центів? Також питання конкретно задається питанням про випадки, коли ви не знаєте можливих сум, які могли б бути в ньому, лише можливих відносних сум, тому я насправді цього не слідкую.
Кітсун Кіннота

Я сказав, що це спрощений підхід. Почалося з «припустимо, що кожен конверт містить паперові гроші в США». Оскільки у паперових грошах у США ви не можете мати 50 центів, Pr (E2 =2|E1=1) = 1. Справа в тому, що припускаючи, що Y / 2 і 2Y однаково ймовірні, коли ви не знаєте Y, передбачається фактичне розподіл для Y, якого неможливо досягти.
JeffJo

0

Як правило, проблема нерозв'язна, оскільки ви не вказали процедуру рандомізації всього експерименту.

Але нехай Y - значення конверта, який ви вибрали, а X - інший конверт. Відповідь тодіE[X|Y=y]- що є умовним очікуванням . Однак, припускаючи найбільш загальне розподіл Y, Y рівномірно виведено з усіхR. Але потімPr(Y=y)=0, і за парадоксом Бореля – Колмогорова очікування нерозв'язне.


@JeffJo, я не міг коментувати ваш пост через те, що не маю достатньої репутації. Я додав цю відповідь, тому що я вважаю, що вона пов’язана з вашою публікацією.
Джон Рембо
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.