Ви спостерігаєте за k головами з n кидок. Монета справедлива?


13

Мене в інтерв'ю мені задали це запитання з . Чи є "правильна" відповідь?(n,k)=(400,220)

Припустимо, що кидки є iid, а ймовірність голів . Тоді розподіл кількості голів у 400 кидках повинен бути близьким до нормального (200, 10 ^ 2), так що 220 голів - це 2 стандартних відхилення від середнього. Імовірність спостереження за таким результатом (тобто більше 2 SD від середнього в будь-якому напрямку) трохи менше 5%.p=0.5

Інтерв'юер сказав мені, по суті, "якщо я спостерігаю щось> = 2 СД від середнього значення, я роблю висновок, що щось інше відбувається. Я ставлюся за те, щоб монета була справедливою". Це розумно - адже саме це робить більшість тестів на гіпотези. Але це кінець історії? Для інтерв'юера це здавалося "правильною" відповіддю. Я запитую тут, чи виправданий якийсь нюанс.

Я не міг не зазначити, що вирішення того, що монета не є справедливим, є химерним висновком у цьому контексті метання монет. Чи прав я це сказати? Спробую і поясню нижче.

Перш за все, я - і я вважаю, що і більшість людей - маю чіткий досвід щодо монет: вони, швидше за все, будуть справедливими. Звичайно, це залежить від того, що ми маємо на увазі під справедливим - однією з можливостей було б визначити "справедливий" як "з вірогідністю головок" близьким "до 0,5, скажімо, від 0,49 до 0,51".

(Ви також можете визначити "справедливий", що означає, що ймовірність головок становить рівно 0,50; у цьому випадку мати ідеально справедливу монету зараз здається досить неправдоподібно .)

Ваш попередній може залежати не тільки від ваших загальних переконань щодо монет, але й від контексту. Якщо ви витягли монету з власної кишені, ви можете бути впевнені, що це справедливо; якби ваш друг чарівника витягнув його з себе, ваш попередник міг би наділити більше ваги на монети з двома головами.

У будь-якому випадку, легко придумати розумних пріорів, що (i) поставити велику ймовірність справедливості монети та (ii) призвести до того, що ваша задня частина буде досить схожою, навіть після спостереження за 220 головами. Тоді ви б зробили висновок, що монета, швидше за все, виявиться справедливою, незважаючи на те, що спостерігали за результатами 2 СД від середнього.

Насправді, ви також можете побудувати приклади, коли спостереження за 220 головами в 400 кидках робить ваш задній набір більшої ваги, щоб монета була справедливою, наприклад, якщо всі несправедливі монети мають ймовірність голови в .{0,1}

Чи може хтось пролити на це світло на мене?


Після написання цього питання я згадав, що чув про цю загальну ситуацію раніше - чи це не "парадокс" Ліндлі ?

В коментарях Вюбер поклав дуже цікаве посилання: Ви можете завантажити гру , але ви не можете змістити монету . З 3 сторінки:

Немає сенсу говорити, що монета має ймовірність p голів, тому що її можна повністю визначити способом її кидання - якщо вона не кидається високо в повітря зі швидким віджиманням і не потрапляє в повітря з не підстрибуючи, в цьому випадку p = 1/2.

Дуже здорово! Це цікаво пов'язане з моїм запитанням: припустимо, ми знаємо, що монета «швидко кидається в повітря швидко і крутиться в повітрі, не підстрибуючи». Тоді ми, безумовно, не повинні відкидати гіпотезу про те, що монета є справедливою (де "справедлива" тепер означає "мати p = 1/2, коли її кидають так, як описано вище"), тому що ми фактично маємо попереднє, що ставить всю ймовірність на монета справедлива. Можливо, це певною мірою виправдовує, чому мені незручно відкидати нуль після того, як спостерігаються 220 голів.


1
Чи змінилася б якась частина вашого питання, якби ви інтерпретували «монету» як метафору для якогось бінарного процесу, про який ви не мали попередніх знань?
whuber

1
@whuber Це гарне запитання. Я думаю, що в такому випадку я був би набагато більше готовий піти з "відхилити, коли р <= 0,05", хоча я не зовсім впевнений, як це виправдати собі.
Адріан

Ще одне питання, яке мене турбує, - це те, що людину, яка задала питання, цікавила гіпотеза, що p = 0,50 точно. Але якщо ви думаєте, що p постійно поширюється, то ймовірність буде нульовою, незалежно від того, що ви спостерігаєте. Мені здається, що я набагато змістовніше робити висловлювання про належність p до якогось інтервалу. Це було б проблемою в ситуації, коли я не мав попередніх знань і, наприклад, вирішив використовувати єдину форму.
Адріан

3
Це має сенс. Питання, орієнтоване на монети, трохи відволікає увагу, оскільки відповіді на такі запитання, як правило, включаються в обговорення фізики (і витонченості) гортання монети. Ви можете бути шоковані тим, наскільки суперечить реальній ситуації вашим сильним приорам, залежно від того, як монета перевернута. "Немає сенсу говорити, що монета має ймовірність голів"p .
whuber

1
@Adrian DJC MacKay обговорює цю точну проблему (з n = 250, k = 140) у своєму вільному підручнику за цим посиланням: inference.phy.cam.ac.uk/itprnn/book.pdf (p63.) Це може бути цікаво читайте, що він каже. Він доходить до вас подібного висновку.
Flounderer

Відповіді:


4

Стандартний байєсівський спосіб вирішити цю проблему (без нормальних наближень) полягає в тому, щоб явно вказати свою попередню задачу, поєднати її зі своєю ймовірністю, яка розподілена бета-версією. Потім інтегруйте задню частину близько 50%, скажімо, два стандартних відхилення або від 49% до 51% або що завгодно.

Якщо ваша попередня віра є безперервною на [0,1] - напр., Бета (100100) (ця маса кладе багато маси на приблизно справедливі монети) - то ймовірність того, що монета є справедливою, дорівнює нулю, оскільки ймовірність також є безперервною [0 , 1].

Навіть якщо ймовірність того, що монета є справедливою, дорівнює нулю, зазвичай ви можете відповісти на будь-яке запитання, на яке ви збиралися відповісти задньою стороною над ухилом. Наприклад, яка грань казино, враховуючи задній розподіл за ймовірністю монети.


1
+1, але я хотів би трохи доповнити цю відповідь. Припустимо, що ми визначимо справедливу монету як пропонує ОП, і ми хочемо розмістити нашої попередньої ймовірності на цьому. Тоді розумним пріоритетом є , так щоЗ огляду на дані у запитанні, задній розподіл стає а задня ймовірність справедливої ​​монети ще дуже велика:0.49<p<0.5199%pBeta(8300,8300)
P(p(0.49,0.51))=0.99003.
p|dataBeta(8300+220,8300+180)
P(p(0.49,0.51)|data)=0.9886.
кнрумсей

2

Скажімо, для розповсюдження Бернуллі, в даному випадку - кидання монети.

Зрозуміло, що це біноміальний розподіл , і він дійсно близький до .B(n=400,p=0.5)N(μ=200,σ2=100)

Очевидно, що інтерв'юер запитує результат з довірчим інтервалом з , або -значення .k95%B(n=400,p=0.5)pB(n=400,p=0.5,k=220)

У байєсівському підході вашим попереднім є те, що замість іp=0.5π(p=0.5)=0.5π(p0.5)=0.5

Давайте скористаємося ще деякими більш справедливими до того, що і . Ми припускаємо, що має рівномірний розподіл протягом кожного інтервалу.π(0.49p0.51)=0.9π(p<0.49p>0.51)=0.1p

Тоді ми можемо обчислити задній .P(0.49p0.51|k=220)

Або велика ймовірність, що попереднє є нормальним розподілом ~ , або ми можемо припустити набагато меншу дисперсію, таку як .N ( μ = 0,5 , σ 2 = 0,25 ) σ 2 = 0,1pN(μ=0.5,σ2=0.25)σ2=0.1

Тоді обчислюємо задній розподіл як .f ( p | k = 220 )pf(p|k=220)


Моєї репутації мені недостатньо, щоб написати коментар під Запитанням. Натомість я напишу тут щось про те, що ви не можете змістити монету . @Adrian

Ось що ми маємо

  1. Результат експериментуB(n=400,k=220,p=θ)
  2. Теоретичне та експериментальне дослідження « Ви не можете зрушити монету»

Ось наша гіпотеза

θ = 0,5H0: Монета справедлива, абоθ^=0.5

H1 : Дані експерименту неправильно записані

Ось наш результат

  1. Виходячи з документа, який можна завантажити, але ви не можете зрушити монету , ми приймаємо гіпотезу .H0
  2. Виходячи з результату експерименту, що різниця вдвічі перевищує стандартне відхилення, ми маємо приблизно 95% рівень довіри, щоб прийняти гіпотезу , що експериментальне дослідження зафіксовано неправильно.H1

Оскільки -значення для тесту гіпотези для відхилення або або приблизно нижче 5%, ми повинні прийняти їх обоє. Або ми повинні відхилити їх обох.H 0 H 1pH0H1

Інакше ми створюємо подвійний стандарт для тестування гіпотез. Ми не можемо прийняти гіпотезу про те, що кидання монети є справедливим і дані експерименту правильно записані .


Немає сенсу говорити, що монета має ймовірність р голів

У нас є результат експерименту, щоб підтвердити цю гіпотезу.

Якщо експеримент повторюється n разів, чи можливо, у нас є пріоритет для кидання монети як коли n значно більший?N ( μ = 0,5 , σ 2 )pN(μ=0.5,σ2)

Якщо це прийнятно, то ми можемо оцінити з 95% ДІ на основі методу максимальної вірогідності.σs


1
Дякую, Чжан. Один крихітний ніт: якщо ви хочете використати розподіл Normal для свого попереднього над ймовірністю головок, я б сказав, що вам слід усікати його так, щоб p лежав у [0, 1].
Адріан

Звичайно, існує багато розумних попередніх розповсюджень та відповідних плакатів. Справжній сенс мого питання є більш загальним: вирішення того, що монета не є справедливим, мені здається химерним висновком у цьому контексті метання монет. Що ви думаєте з цього приводу - і чому?
Адріан

Зручним передумовою для цього був би бета-розподіл, оскільки він пов'язаний з ймовірністю бінома. Але знову ж таки, справжня суть мого питання є загальнішою, ніж конкретна попередня.
Адріан

π(p=0.5)pU(0,1)E(p)f(p|k=220)p=0.5E(p). І ми легко приймаємо гіпотезу, що монета не справедлива. Тим більше, що в цьому випадку ви не знайдете рішення про монету як про справедливе для химерного висновку.
Чжан Цао

@ user777 Нормальний розподіл відображається двічі у відповіді Чжана, спочатку як наближення до двочленного (великого), а другий як пріоритетний для ймовірності головок (коли він каже, що "попередній - нормальний розподіл p ~ N"). Чжан - ваша редакція про те, що Null є "монета справедлива і дані були правильно записані" є цікавою, дякую, що ви її розмістили.
Адріан
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.