Парадокс в'язня


11

Мені дають вправу, і я не можу це зовсім зрозуміти.

Парадокс в'язня

Трьох в'язнів в одиночній камері, A, B і C, було засуджено до смертної кари в той самий день, але, оскільки є національне свято, губернатор вирішує, що одному буде призначено помилування. Про це інформують ув'язнених, але кажуть, що до дня, призначеного для страти, вони не дізнаються, кого з них потрібно пощадити.

В'язень А каже в'язниці: "Я вже знаю, що принаймні одного, двох інших в'язнів буде страчено, тому, якщо ви скажете мені ім'я того, хто буде страчений, ви не дасте мені жодної інформації про мою власну страту" .

Тюремник приймає це і каже йому, що С обов’язково помре.

Тоді причини: "Перш ніж я знав, що С повинен бути страчений, я мав 1-й із 3-х шансів отримати помилування. Тепер я знаю, що або B, або я буду помилуваний, шанси покращилися до 1 на 2. ".

Але тюремник зазначає: "Ви могли б дійти аналогічного висновку, якби я сказав, що В помре, і я повинен був відповісти або на В, або на С, тож чому вам потрібно було запитати?".

Які шанси А отримати помилування і чому? Побудуйте пояснення, яке б переконало інших у правильності.

Ви могли вирішити це за теоремою Байєса, намалювавши мережу переконань чи здоровий глузд. Незалежно від обраного вами підходу слід поглибити ваше розуміння оманливо простої концепції умовної ймовірності.

Ось мій аналіз:

Це виглядає як проблема Monty Hall , але не зовсім. Якщо A скаже, що I change my place with Bпісля того, як йому кажуть, С помер, у нього є 2/3 шансу врятуватися. Якщо він цього не зробив, то я б сказав, що його шанси жити на 1/3, як, коли ви не змінюєте свій вибір у проблемі Monty Hall. Але в той же час він у групі з 2 хлопців, і один повинен померти, тому спокусливо сказати, що його шанси - 1/2.

Тож парадокс все ще є тут, як би ви підходили до цього. Крім того, я не маю уявлення, як я міг би зробити мережу переконань щодо цього, тому мені цікаво це бачити.


2
"Він в групі з 2 хлопців" не означає "його шанси на 1/2"
Генрі

Відповіді:


8

Спочатку є три можливості з однаковими ймовірностями:

  • А буде звільнено (проблема )1/3
  • B буде звільнено (проблема )1/3
  • C буде звільнено (проблема )1/3

Обіцяючи повідомлення, є чотири можливості з різною ймовірністю:

  • A буде звільнено, і A буде сказано, що B буде виконано (завдання )1/6
  • A буде звільнено, і A сказано, що C буде виконано (завдання )1/6
  • B буде звільнено, а A сказано, що C буде виконано (завдання )1/3
  • C буде звільнено, і A сказано, що B буде виконано (завдання )1/3

Умовно "A сказано, C буде виконано" це стає

  • A буде звільнено, і A сказано, що C буде виконано (завдання )1/3
  • B буде звільнено, а A сказано, що C буде виконано (завдання )2/3

Тож після повідомлення A хотілося б помінятись на B (проблема Monty Hall), але не може і так зберігає початкову ймовірність виконання.2/3


1
Ключовим моментом є обмін на B. Щоб взяти одне із поширених пояснень Monty Hall: Уявіть, що у в’язнях є 1000: А запитує ув’язненого, який дає йому 998 імен. Зрозуміло, що ми просто багато чого дізналися про одного хлопця, який не є А і якого не називають . Але ми нічого про не впізнати А .
Бен Джексон

Я думаю, що в позиції А це дуже гарна стратегія для нього, щоб це попросив охоронець. Потім пізніше поговоріть з Б і запитайте, чи хоче він перейти. Якщо він погоджується, ви, хлопці, можете запитати катів, якщо будь-хто з них буде звільнений, то звільнить іншого. З точки зору Б, його шанси не змінюються, тому немає ніяких причин йому сказати ні (або сказати "так", тож питання про тиск у цій точці)
Cruncher

8

Я думаю, що ви переосмислюєте проблему - це проблема Монті Холл, і така ж логіка застосовується.


Чи можете ви розвиватися? Мене цікавлять міркування, а не відповідь
Бенджамін Крузьє

1
@pinouchon: Тюремник - Монті Холл, а в'язень А - гравець. Вмирання аналогічне отримання кози; помилування аналогічно отримання премії. Тепер ви можете безпосередньо перекласти будь-яке пояснення проблеми, яку вам подобається в Monty Hall: вона охоплює багато міркувань. +1, щоб прочитати babelproofreader, щоб вказати на це.
whuber

Як би ви заперечувати проти цього твердження: But at the same time, he is in a group of 2 guys, and one should die, so it is tempting to say that his chances are 1/2.. А як щодо мережі вірувань?
Бенджамін Крозьє

1
@Pinouchon Було б конструктивно відредагувати своє питання, щоб зосередитись на аспекті мережі переконань. Проблему самого Монті-Холу обговорювали на смерть у багатьох, багатьох місцях, тому я не бачу сенсу переробляти цей матеріал тут.
whuber

Я погоджуюсь, що проблема Монті Холла обговорювалася на смерть, але, незважаючи на твердження захисників та потвор, я не бачу, куди потрапить ув'язнений А, щоб перейти на місця. Якщо у в'язниці було три запечатані конверти, один із яких був помилуваний, а два - із смертними вироками, A вибрав один конверт, а тюремник відкрив інший (точно такі ж правила, як я дав в окремій відповіді) і показав, що він містить смертний вирок, і потім запитав: "Чи хочете ви зберегти конверт, який ви вибрали, чи хочете скористатися?" Я бачу аналогію
Діліп Сарват

3

Я не зовсім впевнений, що згоден з @babelproofreader, що це проблема Monty Hall і застосовується та ж логіка. У проблемі Monty Hall ви спускаєтесь і вибираєте одну двері. Правила полягають у тому, що Монті знає, де знаходиться приз, ніколи не відчинить двері, яка приховує приз, і завжди відкриє одну з невідкритих дверей (тобто якщо ви вибрали двері без призу, він не відчинить двері у вас Виберіть і скажіть: "Вибачте, ви програєте!" і відправте вас на своє місце), і він завжди запропонує вибір для переходу на іншу (нерозкриту незакриту) двері (тобто він не запропонує вибір лише тоді, коли ви вибрали двері з призом.) У цих умовах, якщо позначає подію, що ваш початковий вибір - це двері з призом, то . ЯкщоAP(A)=13B - це випадок, коли ваш остаточний вибір - це двері з призом

  • якщо ваша стратегія завжди залишається поставленою , тоді (оскільки ви зробили правильний вибір на початку і дотримуєтесь цього) і (тому що ви зробили неправильний вибір на початку і дотримуються його). Тож за законом повної ймовірності P(BA)=1P(BAc)=0
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=1×13+0×23=13
  • якщо ваша стратегія полягає в тому, щоб завжди перемикатися , то (оскільки ви зробили правильний вибір на початку, а потім переключились) і (тому що ви зробили неправильно вибір на початку, і тому залишилися (неприбрані незакриті) двері гарантовано отримають приз). Тож за законом повної ймовірності P(BA)=0P(BAc)=1
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=0×13+1×23=23

Тут ситуація інша. Місце з не змінюється, як в "Якщо A каже, що я міняю місце з B після того, як йому кажуть, що C помер, у нього є 2/3 шанси бути врятованими". B

Додані коментарі: Ще одна відмінність полягає в тому, що А не володіє інформацією щодо того, чи знає в'язниця, кого буде помилувано, чи в'язниця говорить правду, коли каже, що С буде страчений. З іншого боку, тюремник цілком коректний, коли зауважує, що його розповідь про те, що буде виконано С, не передало жодної корисної інформації А. Найближча аналогія до проблеми Монті Холл полягає в тому, що після того, як А обрав двері, Монті відкриває неприбрані двері, щоб розкрити козла, і каже А: "Відкрий свої двері, і подивимося, що у тебе є", тобто немає пропозиції перемикача. Тож шанс А на виграш премії (Монті Холл) або помилування (проблема з ув'язненим) однаковий: з313 незалежно від того, відкриває Монті неприбрані двері, щоб розкрити козла чи ні, або тюремник каже А, що С буде виконаний, чи ні, саме так, як Генрі детально розраховував.


Я думаю, ми можемо припустити, що в'язниця має таку інформацію, інакше про проблему не варто міркувати (якщо у в'язниці невідома ймовірність брехні, то вони також могли нічого не сказати). Що стосується вашого першого пункту: впевнений, результат інший, ніж у проблемі Monty Hall, оскільки немає можливості перемикатися. Але логіка та сама: розкриваючи один варіант, який не є переможцем, надається інформація про інший варіант, який тюремник / Монті міг обрати.
Рубен ван Берген

2

Відповідь залежить від того, як тюремник обирає, кого в’язня назвати, коли він знатиме, що його потрібно помилувати. Розглянемо два правила:

1) Тюремник обирає серед B і C випадковим чином, і випадково сказав, що C в цьому випадку. Тоді ймовірність помилування А - 1/3.

2) В'язниця завжди говорить C. Тоді шанс помилування - 1/2.

Все, що нам кажуть, це те, що тюремник сказав С, тому ми не знаємо, яких із цих правил він дотримувався. Насправді, можуть бути й інші правила - можливо, тюремник котить матрицю і каже лише C, якщо він катає 6.



0

Уявіть, що тюремник каже А, що С обов'язково помре. А потім він каже Б, що С неодмінно помре. Зрозуміло, що в цьому випадку A і B мають пробачити по 50%. Але в чому різниця між двома версіями?


0

Три укладених проблема це відрізняється від Monty Hall. Ймовірність помилувати насправді для Аліси, а не , але тільки якщо тюремник дотримується стратегії "завжди називай Боба, коли можливо".1/22/3

Події: - Аліса помилувана. Те ж саме для і . - тюремник повідомляє Алісі ім'я "Боб" (як відповідь на "хто буде страчений"). - він каже ім'я "Карл". Він не може назвати себе Алісою через правила.ABCJJc

Нас цікавить . Зараз є два сценарії:P(A|J)=P(J|A)P(A)/P(J)

  1. Тюремник кидає монету, перш ніж сказати B або C: .P(J|A)=12

P(A|J)=12×13/12=13
  1. Тейлер повідомляє ім'я Боба, коли це можливо: , також і .P(J|A)=1P(J|C)=1P(J|B)=0

P(J)=P(J|B)P(B)+P(J|Bc)P(Bc)=0×13+1×23=23

P(A|J)=1×13/23=12

1
Невже "завжди ім'я Карла, коли це можливо" не буде таким правдоподібним, як "завжди називайте Боба, коли це можливо"?
Juho Kokkala

Так, стратегія S '= "завжди називайте Карла, якщо можливо" повинна бути повністю рівнозначною, якщо ми відповідно визначимо J. Якщо ми залишимо J таким, який є, і змусимо тюремника слідувати за S ', це зробить все заздалегідь визначеним: коли J (тюремник каже Боб), ми знаємо, що сказати "Carl" не вдалося, таким чином Карл був помилуваний .
Михайло Волхов

-1

Отримавши інформацію про те, що ув'язнений С помре, його шанси змінюються на 1/2, але тільки тому, що шанси, що він отримає цю інформацію, вже є 2/3 (1/3 можливість ув'язненого С отримати помилування усувається )

І 2/3 * 1/2 - це первісна ймовірність звільнення.

Більш переконливим є опозиційний підхід:

Припустимо, що йому сказано, що ув'язнений С отримає помилування.
Які шанси його не вбити?
Усі визнають, що його шанси дорівнюють нулю, якщо припустити, що тюремник не бреше, і є лише одне прощення.

Цього разу він має шанс 1/1, адже шанс на цю інформацію був уже 1/3.


Це неправильно; дивіться підрахунок у відповіді Генрі, який показує, що, почувши інформацію в'язниці, у в'язня А є 2/3 шансу померти (не 1/2). Це та сама ймовірність, яку він мав і раніше, тому тюремник має рацію: те, що він сказав А, нічого не змінило на життєвий шлях А. Якби B слухав, хоч зараз він би знав, що його шанс померти зменшився до 1/3.
Рубен ван Берген
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.