Проблема Монті Холл Проблема зі схильним монтієм


23

Монти досконало знав, чи за дверима стоїть коза (чи вона порожня). Цей факт дозволяє гравцеві удвічі підвищити свою успішність, переключивши «здогадки» на іншу «Двері». Що робити, якщо знання Монті були менш ніж досконалими? Що робити, якщо іноді Премія справді БУЛА в тих же дверях, що і Коза? Але ви не могли його побачити, поки не вибрали і не відчинили ВАШІ двері? Чи можете ви допомогти мені зрозуміти, як обчислити ПЧ - і на скільки - Гравець може покращити свій успіх, коли рівень точності Монті менше 100%? Наприклад: що робити, якщо Монті помиляється - в середньому-50% часу? Чи може гравець ВІДПОВІДНО отримати вигоду від перемикання своєї здогадки / дверей? Я гадаю, що якщо у Monty є менше 33,3% шансів виправити, що приз не за дверима, то найкращий варіант гравця - НЕ перемикати свій вибір на двері. Чи можете ви, будь ласка, надати мені спосіб обчислити потенційну вигоду від переключення, вставивши різні ймовірності того, що Монті буде правильним щодо того, що премія НЕ відстає від дверей? У мене немає нічого, крім математики середньої школи, і мені 69 років, тому будь ласка, будь ласка.


Дякуємо за надані уявлення та формули. Схоже, що якщо "Fallible Monty" є лише 66% точним при прогнозуванні відсутності премії / автомобіля, існує користь ZERO для переходу з вашого первісного вибору дверей .... тому що його 33% похибка - це за замовчуванням базовий розмір премії за будь-якими дверима. Можна припустити, що IF Monty стає кращим, ніж 66% при передбаченні того, що немає НАГОРОДІ ТАКОЖ переключення, отримує більшу корисність. Я спробую застосувати це міркування до гри, де "Експерт" робить "експертний прогноз", що один з трьох приблизно однаково вірогідних варіантів буде правильним. Я мало вірю в те, що Експерт є правильним, і я впевнений, що його "показник ударів" буде менше 33% - більше, ніж 15%. Мій висновок з цього буде, що коли "той же варіант, що і я, я, мабуть, помиляюся напевно, і слід змінити один з двох інших! ;-)


5
Якщо точність Монті менше 100%, чи означає це, що він іноді відчиняє двері з призом за ним? Якщо так, то, ймовірно, слід вибрати ці двері.
Факс

Відповіді:


35

Почнемо з регулярної проблеми Monty Hall. Три двері, за однією з яких стоїть машина. Інші двоє мають коз за собою. Ви вибираєте двері номер 1, і Монті відкриває двері номер 2, щоб показати вам, що за цією козою. Чи слід переключити свою здогадку на двері №3? (Зверніть увагу, що цифри, які ми використовуємо для позначення кожної двері, тут не мають значення. Ми можемо вибрати будь-який порядок, і проблема однакова, тому для спрощення речей ми можемо просто використовувати цю нумерацію.)

Відповідь звичайно - так, як ви вже знаєте, але давайте переглянемо розрахунки, щоб побачити, як вони змінюються згодом. Нехай - покажчик дверей з машиною, а позначає випадок, коли Монті виявив, що у двері 2 є коза. Нам потрібно обчислити . Якщо це більше , нам потрібно переключити свою здогадку на цю двері (оскільки у нас є лише два варіанти). Ця ймовірність задається через: (Це просто застосування правила Байєса з плоскою до початку ). дорівнює 1: якщо машина знаходиться за дверима номер 3, то у Монті не було іншого вибору, як відкрити номер дверей 2, як і він. CMp(C=3|M)1/2

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
Cp(M|C=3)p(M|C=1)1/2р(М|C=2)p(C=3|Mдорівнює : якщо машина стоїть за дверима 1, тоді у Монті був вибір відкрити одну з дверей, що залишилися, 2 або 3. дорівнює 0, тому що Монті ніколи не відчиняє двері, що він знає має машину. Заповнюючи ці числа, отримуємо: Який результат ми знайомі.1/2p(M|C=2)
p(C=3|M)=10.5+0+1=23

Тепер давайте розглянемо випадок, коли Монті не досконало знає, у яких дверях є машина. Отже, коли він обере свої двері (які ми будемо продовжувати називати дверима №2), він може випадково обрати ту машину, бо вважає, що в ній є коза. Нехай - це двері, на які Монті думає, що має машину, і нехай є ймовірністю того, що він думає, що машина знаходиться в певному місці, що залежить від її фактичного місця розташування. Будемо вважати, що це описується одним параметром який визначає його точність, таким чином: . Якщо дорівнює 1, Монті завжди правий. ЯкщоC р ( С ' | З ) д р ( С ' = х | З = х ) = д = 1 - р ( С 'х | З = х ) д д д 1 / 3p(C|C)qp(C=x|C=x)=q=1p(Cx|C=x)qqє 0, Монті завжди помиляється (що досі інформативно). Якщо дорівнює , інформація Монті не краща, ніж випадкові здогадки.q1/3

Це означає, що тепер у нас є:

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
=p(M|C=1)p(C=1|C=3)+p(M|C=2)p(C=2|C=3)+p(M|C=3)p(C=3|C=3)
=12×12(1q)+0×12(1q)+1×q
=14q4+q=34q+14

Тобто, якби машина справді була за дверима 3, існували три можливості, які могли б зіграти: (1) Монті подумав, що це позаду 1, (2) Монті подумав 2 або (3) Монті подумав 3. Останній варіант виникає з ймовірністю (як часто він має право), інші два розділяють ймовірність того, що він між ними між ними. Тоді, враховуючи кожен сценарій, яка ймовірність, що він вирішив би вказати на двері номер 2, як це зробив? Якби він вважав, що машина відстає від 1, ця ймовірність була 1 на 2, оскільки він міг обрати 2 або 3. Якби він вважав, що це позаду 2, він ніколи не обрав би бал на 2. Якби він вважав, що це за 3 , він завжди вибрав би 2.q(1q)

Можна аналогічно опрацювати решта ймовірностей:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

Заповнивши все це, отримуємо: Як перевірка , коли , ми можемо побачити, що ми повертаємося до початкової відповіді .

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
q=111.5=23

Отже, коли ми повинні переключитися? Я вважаю, що для простоти нам заборонено переходити на двері, на які вказував Монті. Насправді, доки Монті хоча б дещо вірогідний (більше, ніж випадкові здогадки), двері, на які він вказує, завжди будуть рідше, ніж інші матимуть машину, тож це непридатний варіант для нас все одно. Тож нам потрібно лише врахувати ймовірність дверей 1 і 3. Але хоча автомобіль знаходився за дверима 2, то цей варіант зараз має ненульову ймовірність, і тому вже не так, що нам слід перемикатися коли , але, швидше, ми повинні перемикатися, коли (що раніше було одне і те ж). Ця ймовірність задаєтьсяp(C=3|M)>0.5p(C=3|M)>p(C=1|M)p(C=1|M)=0.51.5=13те саме, що і в оригінальній проблемі Monty Hall. (Це має сенс, оскільки Монті ніколи не може вказувати на двері 1, незалежно від того, що знаходиться за нею, і тому він не може надати інформацію про ці двері. Швидше, коли його точність опускається нижче 100%, ефект полягає в тому, що деяка ймовірність "просочується" до дверей 2 насправді є машина.) Отже, нам потрібно знайти такий, що : qp(C=3|M)>13

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
Таким чином, це був дуже довгодушний спосіб з'ясувати, що, поки знання Монті про справжнє місце автомобіля краще, ніж випадкова здогадка, ви повинні переключити двері (що насправді є таким очевидним, коли ви думаєте про це ). Ми також можемо обчислити, наскільки більше шансів перемогти, коли ми переходимо, як функцію точності Монті, оскільки це задано: (Що при дає відповідь 2, що відповідає тому, що ми подвоюємо наші шанси на перемогу, замінивши двері в оригінальній проблемі Monty Hall.)
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
q=1

Редагувати: Люди запитували про сценарій, коли нам дозволяється перейти на двері, на які вказує Монті, що стає вигідним, коли , тобто коли Монті є (дещо) надійним "брехуном". У найбільш екстремальному сценарії, коли , це означає, що двері, що Монті думає, у машини напевно є коза. Зауважте, що на двох інших дверях все-таки може бути або машина, або коза.q<13q=0

Перевага переходу на двері 2 надається: що є лише більшим за 1 (і, таким чином, варто перейти на цю двері), якщо , тобто якщо , який ми вже встановлений був переломним моментом. Цікаво, що максимально можлива вигода для переходу на двері 2, коли , становить лише 1,5, порівняно з подвоєнням ваших шансів на перемогу в оригінальній проблемі Monty Hall (коли ).

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
1.5q<0.5q<13q=0q=1

Загальне рішення дає комбінування цих двох стратегій перемикання: коли , ви завжди переходите на двері 3; в іншому випадку перейдіть на двері 2. q>13


Чи не насправді очікуване значення повернеться назад q < 1/3, оскільки це не моделює наскільки він може бути точним, це моделює, наскільки ймовірно, він помиляється? З наближенням до 0 це означає, що він завжди бреше, якщо зможе, і очікуваний виграш повернеться до 2/3
Cireo

2
@Cireo Він не бреше, він просто помилиться. Брех би означав, що він знає, що його відповідь була неправильною. Я підозрюю, що очікувана величина не повертається назад, тому що ймовірність того, що він випадково вказує на двері з машиною, що знаходиться за нею (тобто p (M | C = 2) піднімається), і ви не можете вибрати ті двері, незважаючи ні на що). q = 0 означає, що він завжди помиляється на тому, де знаходиться машина, тобто зараз є відносно велика ймовірність того, що він вкаже на двері з автомобілем, що знаходиться за нею.
Бурман

3
Більш загальне рішення (яке, очевидно, потребує цього), включає "ворожий" Монті; той, хто змінює те, на що він вказує (або навіть якщо він щось вказує), залежно від того, ви вибрали козу чи машину.
Якк

3
@Yakk: Існує нескінченно багато інших сценаріїв, які можна уявити, що змінюють шанси нескінченно багатьма способами. Все також залежить від того, чи знаєте ви, як працює Monty. Якщо ви знаєте, що він ворожий, то насправді він не може зменшити ваші шанси нижче 1/3, тому що ви просто вирішите ігнорувати все, що він робить. Якщо ви не знаєте його процесу прийняття рішень, то це повністю залежить від того, що ви припускаєте і що він точно робить, і там є багато ступенів свободи.
Рубен ван Берген

1
@KalevMaricq: Я не дуже говорив про те, що брешемо Монті. Проблема в тому, що автомобіль міг би опинитися за дверима, яку ви спочатку вибрали, яку Монті не вибирають (інакше я б заперечував, що це вже не проблема Монті-Холу). Тож у нього можуть бути лише дві козячі двері, які він може вибрати, і в цьому випадку він не може брехати, сказавши, що за однією з них стоїть коза. Тому я не думаю, що в межах проблеми можна побудувати справжнього "брехуна Монті". Що я пішов натомість (для ) - це Монті, який завжди помиляється на козлі для дверей автомобіля, але ми не знаємо, яка коза. q=0
Рубен ван Берген

7

Це має бути досить простою варіантом проблеми (хоча я зауважую ваш обмежений досвід математики, тому я думаю, що це відносно). Я б запропонував спершу спробувати визначити рішення залежно від того, чи Монте непогрішний, чи повністю помилковий. Перший випадок - це просто звичайна проблема Монте Холл, тому роботи там не потрібно. У другому випадку ви розглядаєте двері, які він вибирає, як випадкові по всіх дверях, включаючи двері з призом (тобто він все одно може вибрати двері без премії, але це зараз випадково). Якщо ви можете розрахувати ймовірність виграшу в кожному з цих випадків, тоді ви використовуєте закон повної ймовірності визначити відповідні ймовірності виграшу у випадку, коли Монте має певний визначений рівень помилковості (визначений ймовірністю того, що ми є непогрішними проти повністю помилковими).


2
Я ціную відповідь, але шукав щось більш конкретне. Я уточнюю, що Монті вибрав Двері. Я уточнюю, що ймовірність того, що приз буде за тими дверима, може бути десь від нуля до 100%. Я сподівався на формулу, яка дозволить мені просто ввести ймовірність того, що Монті правильний / неправильний, а потім опрацювати решту формули дасть чисельну оцінку, яка вказує на ймовірність того, що переключення призведе до виграшу. Це ступінь допомоги нереальний запит?
Псевдоего

4

Спираючись на коментарі до відповіді Бена, я пропоную дві різні інтерпретації цього варіанту Монті Холл, що відрізняються від Рубен Ван Бергена.

Перший я буду називати брехуном Монті, а другий - Ненадійним Монті. В обох версіях проблема триває наступним чином:

(0) Є три двері, за однією з яких стоїть машина, а за двома двома - кози, розподілені випадковим чином.

(1) Учасник вибирає двері навмання.

(2) Монті підбирає двері, що відрізняються від дверей учасника, і стверджує, що за ним стоїть коза.

(3) Учаснику конкурсу пропонується перейти на третю незабрану двері, і проблема полягає в тому, "Коли учасник повинен переключитися, щоб збільшити ймовірність знайти машину за дверима?"

У Liar Monty, на етапі (2), якщо учасник вибирав двері, що містять козу, тоді Монті вибирає двері, що містять машину, з певною заздалегідь визначеною ймовірністю (тобто є шанс між 0 і 100%, що він буде брехати, що коза за деякими дверима). Зауважте, що в цьому варіанті Монті ніколи не вибирає двері, що містить машину (тобто не може брехати), якщо учасник вибирав машину на етапі (1).

2313

Щоб відповісти на проблему, нам доведеться використовувати деякі рівняння. Я спробую сформулювати свою відповідь, щоб вона була доступною. Дві речі, які, я сподіваюся, не надто заплутані - це алгебраїчна маніпуляція символами та умовна ймовірність. Для перших ми будемо використовувати символи для позначення наступного:

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

Pr()Pr(M¯)

Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13

Pr(M|C¯)Pr(M) Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯)

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
Pr(C¯)23Pr(C¯|M)

23

Pr(S)

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
Pr(S|C)=Pr(S|C¯ and M)=0Pr(S|C¯ and M¯)=1

Продовження:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

So you see, when Monty always lies (aka Pr(M|C¯))=1) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S), is 23.

From this you can work out the optimal strategies for both Liar, and Unreliable Monty.

Addendum 1

In response to comment (emphasis mine):

"I added more details in my comment to @alex - Monty is never hostile nor devious, just FALLIBLE, as sometimes he can be wrong for whatever reasons, and never actually opens the door. Research shows that Monty is wrong roughly 33.3% of the time, and the car actually turns out to be there. That is a Posterior Probability of being correct 66.6% of the time, correct? Monty never chooses YOUR door, and you will never choose his. Do these assumptions change anything?"

This is as I understand, the Unreliable Monty Hall Problem introduced at the start of my answer.

Therefore, if Monty's door contains the car 13 of the time, we have the probability of winning when you switch to the last unpicked door as:

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)


Alex and @Ruben van Bergen et al Thanks for the helpful details. Assume Monty's never hostile, just fallible and tells you "I am pretty sure that the the Car is NOT behind this door." but does not open the door. Let's assume Research shows he is WRONG only about 33.3% of the time, thus correct 66.6% (a Posterior Probability?). There is still some benefit to switching, but once his accuracy reaches only 33.3% then it would make NO sense to switch to either HIS door or the other one. Literally a case of "your guess is as good as mine." Does any of this change your Analyses or Formulae?
Pseudoego

No, this doesn't change my analysis. I added something which I hope clarifies the question in your comment. Btw, I wouldn't read too much into the words "hostile", "fallible", "monty lies". These don't really mean anything unless defined with precision as the (conditional) probability that Monty is wrong about a door containing a goat.
Alex

Pretty annoyed that my OWN answer to MY OWN question would be deleted with the only explanation given is that this site is not for "discussion" - when I am mainly explaining why I think the Answers given so far are Correct, and explaining how they will be useful. There was far more discussion in most of the other answers given. This seems myopic to me - at best - and moronic - at worst - to delete somebody's answer to their own question: how can you possibly explain WHY you are rating an Answer as the BEST without discussing it? Thanks to all who replied regardless.
Pseudoego

@Pseudoego your last comment is better post as a comment on your original question. I didn't see your answer, but it sounds like you want to discuss the existing answers, in which case you can modify your original question.
Alex

0

For some reason, a moderator decided to delete my own answer to my own question, on the grounds that it contained "discussion." I don't really see HOW I can explain what is the Best Answer without discussing what makes it work for me, and how it can be applied in practice.

I appreciate the insights and formulae which were provided in the previous answers. It appears to be that IF "Fallible Monty" is only 66% accurate in predicting the absence of a Prize/Car THEN there is ZERO benefit to switching from your original choice of doors....because his 33% error rate is the default base rate for the Prize being behind ANY door. One assumes, though, that IF Monty gets better than 66% at predicting where there is NO PRIZE THEN switching derives greater Utility.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.