Ставка Блеквелла


12

Я читав про парадокс ставок Блеквелла на шафу «Марність» . Ось резюме: ви з двома конвертами, і . Конверти містять випадкову суму грошей, але ви нічого не знаєте про розподіл про гроші. Ви відкриваєте один, перевірити , скільки грошей там ( ), і доводиться вибирати: взяти конверт або ?ExEyxExEy

Шафа марності посилається на математика, який називається Леонардом Вапнером: "Несподівано, ви можете зробити щось, окрім відкриття іншого конверта, щоб зробити себе кращим, ніж навіть шанс виправити це правильно".

Ідея, яка мені здається неправильною, полягає в наступному: виберіть випадкове число . Якщо , візьміть . Якщо , виберіть .dd<xExd>xEy

Вапнер: “Якщо d падає між x і y, то ваш прогноз (як зазначено в d) гарантовано є правильним. Припустимо, це відбувається з ймовірністю p. Якщо d падає менше x і y, то ваш прогноз буде правильним лише у тому випадку, якщо обране вами число x буде більшим за два. 50 відсотків шансів на це. Аналогічно, якщо d більше обох чисел, ваш прогноз буде правильним, лише якщо вибране число буде меншим з двох. Це також відбувається з 50-відсотковою ймовірністю. "

Якщо ймовірність того, що знаходиться в [ x , y ] , більше нуля, то середній успіх цього методу дорівнює 1d[x,y] . Це означало б, що спостереження за незв'язаною випадковою змінною дає нам додаткову інформацію.12+p2

Я думаю, що це все неправильно, і що проблема полягає у виборі випадкового цілого числа. Що це означає? Мовляв, будь-яке ціле число? У цьому випадку ймовірність що d лежить між x і y, дорівнює нулю, оскільки і x, і y є кінцевими.pdxyxy

Якщо ми скажемо, що існує обмеження на максимальну кількість грошей, скажімо, або, принаймні, ми вибираємо d від 1 ... M , то рецепт зводиться до банальної поради щодо вибору E y, якщо x < M / 2 і вибір E x, якщо x > M / 2 .M1...MEyx<M/2Exx>M/2

Я щось тут сумую?

EDIT

Гаразд, зараз я починаю бачити, звідки береться очевидний парадокс. Мені здавалося неможливим, що незв'язана випадкова величина може надати додаткову інформацію.

Однак зауважте, що нам потрібно свідомо вибирати розподіл d . Наприклад, вибираємо межі для рівномірного розподілу, або Поассіонівського розподілу тощо. Зрозуміло, якщо ми граємо за арахіс, і ми вибрали розподіл d рівномірним на [ 10 9 , 2 10 9 ] доларів, P ( d ( x , y ) ) = 0 . Ця остання ймовірність залежатиме насамперед від нашого судження про те, що може бути в конвертах.λ[109,2109]P(d(x,y))=0

Іншими словами, якщо техніка працює, то припущення, що ми не знаємо, що таке розподіл грошей у конвертах (як було обрано кількість грошей для конвертів), порушується. Однак якщо ми справді не знаємо, що є в конвертах, то в гіршому випадку ми нічого не втрачаємо, застосовуючи його.

EDIT 2

Ще одна думка. З огляду на , виберемо для малювання d безперервний невід'ємний розподіл, такий що P ( d < x ) = P ( d > x ) . Нам дозволено це робити, я прав? Ми поступаємо за інструкцією - якщо d < x , ми зберігаємо конверт, якщо d > x , ми змінюємо конверт. Міркування не змінюється, залежно від того, як ми обираємо розподіл, може бути, що P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0 (чи я помиляюся?).

Однак, враховуючи те, як ми обрали дистрибуцію, те, що ми зараз робимо, еквівалентно киданню монети. Ми кидаємо монету, і якщо це голови, ми міняємо конверти, якщо це хвости, приклеюємо до конвертів, які ми тримаємо. Де я помиляюся?

EDIT 3 :

Гаразд, я розумію це зараз. Якщо ми базуємо функцію ймовірності на x (наприклад, відбираємо d з рівномірного розподілу в діапазоні ( 1 , 2 x ) , то ймовірність P ( d ( x , y ) ) не залежить від P ( правильне рішення | d ( x , y ) ) .dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Отже, якщо (з ймовірністю p ), здогад завжди правильний, як і раніше. Однак якщо x є нижчим числом, а d ( x , y ) , то d має більший шанс бути меншим за x, ніж бути вищим за x , тому ми упереджено ставимося до неправильного рішення. Те ж міркування застосовується, коли х вище двох чисел.d(x,y)pxd(x,y)dxxx

Це означає, що ми повинні вибирати процес малювання незалежно від x . Іншими словами, нам потрібно здогадатися про параметри розподілу, з яких черпаються х і у ; Найгірше, що трапляється, це те, що ми все ще здогадуємось випадковим чином, але найкраще, що трапляється, щоб наші здогадки були правильними - і тоді ми маємо перевагу. Як це має бути краще, ніж здогадуватися "x і y, я думаю, буде принаймні 1 $ , але щонайбільше 10 $ , так що якщо x > 5 , ми зберігаємо його, а якщо ні, ми обмінюємо його" я ще не побачити.dxxyx>5

Мене введено в оману поп-науковою постановкою проблеми в книзі Вапнера ( Неочікувані очікування: Цікавості математичного кришталевого кулі ), в якій говориться

"У будь-який спосіб виберіть випадкове додатне ціле число" (Вапнер пропонує геометричний розподіл - метання монет, поки не з’являться перші голови, повторюючи процес, якщо ) "Якщо d > x здогадується вище, а якщо d < x здогадується нижче. (...) Ви правильно здогадаєтеся більше 50 відсотків часу, оскільки d вказує правильно більше 50 відсотків часу! "d=xd>xd<xd


1
Дуже тісно пов'язані: stats.stackexchange.com/questions/95694
whuber

2
Це сильно відрізняється від задачі двох конвертів у тому сенсі, що: (1) аргумент, наведений для перемикання на проблему з двома конвертами, є помилковим, недолік аргументу можна побачити, додавши байєсівський попередній час (2) аргумент Наданий Вапнером за ставку Блеквелла є правильним.
Меттью Ганн

Якщо суми грошей у конвертах є довільними елементами набору чисел S, достатньою та необхідною умовою для стратегії Вапнера є створення CDF числа, яке ви вирішите суворо збільшувати на S.
Відновіть Моніку

Гаразд, мені все-таки щось не вистачає - дивіться мою EDIT 2, але мені здається, що ми можемо просто кинути монету, і вона все одно повинна працювати, згідно з міркуванням. Де я помиляюся?
січня

Відповіді:


8

Це більш відома як проблема двох конвертів . Найчастіше суми наводяться як і 2 A, але це не обов'язково.A2A

Деякі моменти:

  1. Ви не можете вибирати випадкове ціле число рівномірно *, але цитується частина, здається, не вимагає, щоб воно було рівномірним. Виберіть розподіл - неважливо, що це за аргумент - доки він має певну ймовірність перевищення будь-якого кінцевого значення.

  2. Не було б сенсу обирати ціле число з цитованим правилом рішення, оскільки гроші дискретні, що означає, що шанс d = x є ненульовим, а для цього випадку нічого не вказано. (Або, як варіант, змінити правило, щоб вказати, що робити, коли вони рівні)d d=x

  3. Залишаючи це осторонь, ви могли вибрати із деякого негативного безперервного розподілу - тоді ми не повинні турбуватися про рівність.d

* (а також не можна вибрати рівномірно випадкове невід'ємне ціле число, а також рівномірно випадкове додатне ціле число)


Якщо ми скажемо, що існує обмеження на максимальну кількість грошей, скажімо, або, принаймні, ми вибираємо d від 1 ... M , то рецепт зводиться до банальної поради щодо вибору E y, якщо x < M / 2 і вибір E x, якщо x > M / 2Md1...MEyx<M/2Exx>M/2

Якщо виявиться, що випадковий розподіл, з якого обрано , охоплює M / 2, це повинно працювати (краще, ніж 50-50); якщо розподіл застряг в одній половині, він би не став.xM/2

Однак версії цієї гри, які мені вперше представили, - це те, що конверт подає той, хто (можливо) прагне мінімізувати ваш дохід від гри. Стратегія використання дистрибутива для вирішення питання про перехід на інший конверт все ще працюватиме в цьому випадку.


dP(d<x)=P(d>x)

P(d<x)=P(d>x)

d

зробивши свою стратегію функцією x, ви не даєте собі переваги зробити правильний вибір, коли d знаходиться між x і y - ви визначаєте свій шлях виграти гру. Якщо за посиланням ви заявляєте, що така стратегія спрацює, вона помиляється
Glen_b -Встановіть Моніку

dxP(d(x,y))>0x(1,2x)d(x,y)
січня

7

Аргумент Вапнера правильний!

Деякі коментарі:

  • x<dd
  • d
  • У певних ситуаціях (наприклад, де чим більше ви спостерігаєте, тим більше шансів на те, що у вас великий конверт), стратегія відсічення навіть оптимальна.
  • У більш загальній байєсівській обстановці ви можете зробити краще, ніж просту стратегію відсічення для багатьох пріорів.

Пов'язана, але інша проблема:

Як згадували декілька @Glen_b та @whuber, існує відповідна загадка, відома як « Проблема з двома конвертами», де наведено помилковий аргумент за те, що завжди перемикають конверти, і недолік аргументу можна побачити, застосувавши байєсівський підхід та додавши попередні переконання вміст двох конвертів.

У деякому сенсі, описана тут головоломка є досить різною. Аргумент Вапнера правильний!


1
Гаразд, тепер я бачу, звідки береться парадокс. Або, якщо бути конкретним, де додаткова інформація надходить у систему. Свідомо вибираючи розподіл d , ми використовуємо наші апріорні знання про те, де повинні бути більш-менш суми грошей в обох конвертах. Найгірший сценарій - наші знання марні, але метод гарантує, що ми не будемо в неприємності, якщо використовуватимемо їх.
січня

Подумавши, я все ще не розумію - див. EDIT 2.
січня

1020dP(x<d)=P(x>d)

d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9

xyxdd

0

Мене це заінтригувало і застосував прагматичний підхід грати з ним в Excel.

Я генерував три випадкові числа для x, y і d в діапазоні 1-100. Потім я зробив порівняння між d і x і між x і y і подивився на результат, правильно чи неправильно.

Я робив це 500 разів і повторював це кілька разів і регулярно отримував правильну відповідь від 330 з 500, як було передбачено.

Потім я збільшив діапазон d до 1-10000 і правильна відповідь впала приблизно до 260 за 500 пробігів.

Отже, так, вибір d залежить від очікуваних значень x і y.

ББ


0

Я думаю, що очевидний парадокс із розширенням Вапнера рівняння p + (1-p) / 2 полягає в тому, що він передбачає, що (1-p) / 2> 0. Для багатьох діапазонів d це значення дорівнює 0.

Наприклад: будь-який d, вибраний із симетричного розподілу, орієнтованого на значення у відкритій конверті, дає ймовірність неправильного 1/2 та правильного 1/2.

Будь-який асиметрично обраний розподіл, як видається, упереджує вибір неправильним способом у 1/2 рази.

То чи існує спосіб вибору діапазону та розподілу для d таких, які мають це рівняння?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.