Чи слід використовувати біноміальний cdf або звичайний cdf при гортанні монет?


11

Монету потрібно перевірити на справедливість. 30 голів з’являються після 50 обертів. Якщо припустити, що монета справедлива, яка ймовірність, що ви отримаєте принаймні 30 голів за 50 обертів?

За словами мого вчителя, правильний спосіб вирішити цю проблему - це зробити

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

Однак я взяв биноміальну функцію кумулятивного розподілу на зразок цієї

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

Я вважаю, що критерії біноміального розподілу задовольняються: окремі події є незалежними, можливі лише два результати (голови проти хвостів), ймовірність є постійною для питання (0,5), а кількість випробувань визначається на рівні 50 Але очевидно, що два способи дають різні відповіді, і симуляція підтримує мою відповідь (принаймні, кілька разів я її виконував; очевидно, я не можу гарантувати, що ви отримаєте однакові результати).

Чи помиляється мій учитель, якщо припустити, що крива нормального розподілу також буде вагомим способом вирішити цю проблему (ні в якому разі не сказано, що розподіл є нормальним, але n * p і n * (1-p) обидва більше, ніж 10) чи я неправильно зрозумів щось щодо біноміальних розподілів?


5
Людина, яка має досвід використання Нормальних наближень до Біномалю, поступила б трохи інакше: вони застосовували б (звичайне) виправлення безперервності , як у 1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(це вираз R), значення якого становить 0,1015, за цілком узгодженою з двочленною cdf .
whuber

Відповіді:


10

Ось ілюстрація відповідей вила та одностоп.

корекція безперервності

Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

P(X=k)XBin(50,0.5)P(k12<Y<k+12)P(X30)P(Y>29.5)

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.

4

Нормальний розподіл дає більш близьке наближення до двочлена, якщо ви використовуєте корекцію безперервності . Використовуючи це для свого прикладу, я отримую 0,1015. Оскільки це домашнє завдання, я залишу його вам, щоб заповнити деталі.


4

Розглянемо це. У дискретному двочленному розподілі ви маєте фактичні ймовірності для окремих чисел. У безперервній нормі, що це не так, потрібен діапазон значень. Отже ... якщо ви збиралися наблизити ймовірність індивідуального значення, скажімо, X, з двочлена з нормальним, як би ви це зробили? Подивіться на вірогідність гістограми біноміального розподілу з покладеною на неї нормальною кривою. Вам потрібно було б насправді вибрати від X ± 0,5, щоб зафіксувати щось подібне до того, що біномальна ймовірність X є при нормальному наближенні.

Тепер продовжте це, коли ви вибираєте хвіст дистрибуції. Коли ви використовуєте біноміальний метод, ви вибираєте всю вірогідність цілого значення (у вашому випадку 30) плюс усе вище. Тому, коли ви робите безперервний процес, ви повинні переконатися, що ви захопили це, і виберіть на 0,5 менше, так що відсікання для безперервного розподілу становить 29,5.


3
Власне, питання демонструє продумане розуміння проблеми і, здається, не шукає відповіді на запитання звичайних домашніх завдань. Хоча це позначено домашніми завданнями , врахуйте, як тут зробити виключення. Зокрема, вдале обговорення використання нормального розподілу для наближення дискретних розподілів (таких як біноміали та пуассони з великими N) було б доречним і тут дуже вітається.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.