Поняття статистики, щоб пояснити, чому ви рідше перевертаєте таку ж кількість головок, що і хвостики, оскільки кількість обертів збільшується?


28

Я працюю над вивченням ймовірності та статистики, читаючи кілька книг і записуючи якийсь код, і, моделюючи монети, перевернув монету, я помітив щось, що мене вражало як трохи протилежне до наївної інтуїції. Якщо ви перевернете справедливу монету разів, відношення головок до хвостів збільшиться до 1 у міру збільшення , саме так, як ви очікували. Але з іншого боку, по мірі збільшення виявляється, що ви рідше перевертаєте таку ж кількість головок, що і хвости, отримуючи таким чином співвідношення рівно 1.n nnnn

Наприклад (деякий вихід з моєї програми)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

Моє запитання таке: чи існує поняття / принцип у статистиці / теорії ймовірностей, що пояснює це? Якщо так, то який принцип / концепція це?

Посилання на код, якщо хтось зацікавлений у тому, як я це створив.

- редагувати -

Для чого це варто, ось як я пояснював це собі раніше. Якщо ви переверніть справедливу монету разів і кількість головок, ви, в основному, генеруєте випадкове число. Так само, якщо ви робите те саме, і рахуєте хвости, ви також генеруєте випадкове число. Отже, якщо порахувати обидва, ви дійсно генеруєте два випадкових числа, і як стає більше, випадкові числа стають більшими. І чим більше ви генеруєте випадкові числа, тим більше шансів на те, щоб вони «пропустили» одне одного. Цікавим є те, що два числа насправді пов'язані в певному сенсі, причому їх співвідношення збігається до одного, коли вони збільшуються, хоча кожне число є випадковим у відриві. Можливо, це тільки я, але я вважаю це акуратним. nnn


Ви шукаєте інтуїтивних чи математичних пояснень?
Glen_b -Встановити Моніку

1
Обидва, справді. Я думаю, що я якось розумію причину в інтуїтивному сенсі, але хотів би зрозуміти формальні міркування, що стоять за нею.
розум злочину

1
Чи знаєте ви, як обчислити біноміальні ймовірності та застосувати їх до даної ситуації? Якщо ні, подивіться це і опрацюйте розрахунки.
Марк Л. Стоун

Нічого собі, на це питання є кілька хороших відповідей. Я люблю себе погано приймати одне, а не друге. Дозвольте сказати, що я ціную всі відповіді і всіх, хто потребував часу, щоб поділитися своєю думкою з цього приводу.
розум злочину

Відповіді:


31

Зауважте, що випадок, коли кількість голів та кількість хвостів однакові, є "рівно половиною часу, коли ви отримуєте голови". Тож давайте дотримуватимемося підрахунку кількості голів, щоб побачити, чи це половина кількості кидок або еквівалентно порівняння пропорції голів з 0,5.

Чим більше ви будете перевертати, тим більша кількість можливих підрахунків голів - розподіл стає більш розкинутим (наприклад, інтервал для кількості голів, що містить 95%, ймовірність буде зростати, коли кількість кидків зростатиме) , тому ймовірність рівно половини голів буде знижуватися в міру того, як ми кидаємо більше.

Відповідно, частка голів буде приймати більше можливих значень; дивіться тут, де ми переходимо від 100 тостів до 200 тостів:

введіть тут опис зображення

Зі 100 закидами ми можемо спостерігати пропорцію 0,49 голів або 0,50 голови або 0,51 голови (і так далі - але нічого середнього між цими значеннями), але за 200 кидок ми можемо спостерігати 0,49 або 0,495, 0,50, 0,50 або 0,510 - ймовірність має більше значень, щоб "охопити", і тому кожен прагне отримати меншу частку.

Поміркуйте, ніж у вас є кидок з певною вірогідністю отримання голови (ми знаємо ці ймовірності, але це не критично для цієї частини), і ви додаєте ще два кидання. У кидках головок - найімовірніший результат ( і звідти йде).p i i 2 n n p n > p n ± 12npii2nnpn>pn±1

Який шанс мати голови в закидах?2 n + 2n+12n+2

(Позначте ці ймовірності щоб ми не плутали їх з попередніми; також нехай P (HH) є ймовірністю "Head, Head" у наступних двох кидках тощо)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

наприклад, якщо ви додасте ще дві монети, імовірність середнього значення природно знижується, оскільки вона в середньому визначає найбільш ймовірне (середнє) значення із середнім значенням менших значень будь-якої сторони)

Тому поки вам комфортно, що пік буде посередині (для ), ймовірність рівно половини голів повинна зменшуватися в міру зростання .2n=2,4,6,...n


Насправді ми можемо показати , що при великому , пропорційно зменшується з ( що не дивно, так як розподіл стандартизованого числа головок підходів нормальності і дисперсія частки головок зменшується з ).npn1nn


За запитом, ось код R, який створює щось наближене до вищевказаного сюжету:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
Я погоджуюся з @RustyStatistician вище щодо 1000-слов янності вашої графіки. Додатковий кредит на покажчик на код.
TomRoche

Дивовижна фігура та пояснення!

@Tom я включив код, який робить все, крім того, щоб зробити "200" у заголовку зеленим.
Glen_b -Встановити Моніку

1
@Glen_b Дякую за ще один чудовий пост та щедрість спільного використання рядків коду. Гарний сюжет! Це важко визнати це, але у мене виникають проблеми з математичним виразом концепції в вашому пості, і , зокрема , використання великих літер . P
Антоні Пареллада

1
@Antoni просто означає "ймовірність отримати" голову, голову "на двох додаткових ударах". Щоб отримати n + 1 голови в 2n + 2 кидок, на 2n кидок ви повинні мати або n-1 голови (а потім кинули 2 голови), або n голів (а потім кинули 1 голову) або n + 1 голову (а потім кинули 0 голів). P(HH)
Glen_b -Встановіть Моніку

19

Ми добре знаємо, що Закон про великі числа - це те, що гарантує перший висновок вашого досвіду, а саме: якщо ять разів перевернути справедливу монету , співвідношення голів до хвостиків збільшиться до 1, коли збільшується. nn

Так що проблем там немає. Однак, про все Закон великих чисел говорить нам у цьому сценарії.

Але так, подумайте над цією проблемою більш інтуїтивно. Подумайте про перевернення монети невелику кількість разів, наприклад: .n=2,4,8,10

Коли ви двічі переверніть монету, тобто , подумайте про можливі сценарії двох оборотів. (Тут позначатиме голови, а - хвости). На кулака фліп ви могли б отримати і на другому фліпом ви могли б отримати . Але це лише один із способів, як два фліпси могли підійти. Ви також могли потрапити на перший фліп і на другий фліп , та всі інші можливі комбінації. Отже, наприкінці дня, коли ви перегортаєте 2 монети, можливі комбінації, які ви могли побачити на двох переворотах, - це тож існують 4 можливі сценарії перегортання монети.n=2HTHTTH

S={HH,HT,TH,TT}
n=2

Якби ви перевернули 4 монети, то можлива кількість комбінацій, яку ви могли б побачити, буде і так існує 16 можливих сценаріїв для гортання монети.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Перегортання монет призводить до 256 комбінацій.n=8

Перегортання монет призводить до 1,024 комбінацій.n=10

І зокрема, перегортання будь-якої кількості монет призводить до можливих комбінацій.n2n

Тепер спробуємо підійти до цієї проблеми імовірнісною точкою зору. Озираючись на випадок, коли , ми знаємо, що ймовірність отримати точно стільки ж головок і хвостів (тобто, як ви ставите це співвідношення рівно 1) - Коли , ми знаємо, що ймовірність отримання точно однакової кількості головок і хвостів n=2

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

І взагалі, оскільки має тенденцію до зростання, ми маємо на увазі, що ймовірність отримати точно таку ж кількість Голів і Хвостів переходить до 0.n

n

Pr(Ratio of exactly 1)0

І так, щоб відповісти на ваше запитання. Дійсно, що ви спостерігаєте, це лише наслідок того, що буде набагато більше комбінацій перевертання монет, де кількість голів та хвостів не однакова порівняно з кількістю комбінацій, коли вони рівні.



Як пропонує @Mark L. Stone, якщо вам подобається біноміальна формула та біноміальні випадкові величини, то ви можете використовувати це, щоб показати той самий аргумент.

XnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

Тепер ще раз, оскільки має тенденцію до зростання, вищевказаний вираз має тенденцію до 0, оскільки як .n(nn/2)0.5n0n


2
Вам потрібно сказати трохи більше, ніж як ... вам також потрібно сказати щось про . (Для порівняння: тільки тому, що , не означає ). 0.5n0n 0,5п0н! 0,5n0(nn/2)0.5n0n!0.5n0
Срібна рибка

@Glen_b У мене недостатньо балів, щоб коментувати твій пост, але дивовижна графіка!

Дякуємо @RustyStatistician, що дуже допомагає. Перша частина вашого пояснення в значній мірі відповідає тому, як я про це думав, але я не зовсім далеко, разом зі своєю статистикою, ще не знаю, як це опрацювати за допомогою розподілу біном. Я в основному читав свою книгу один раз, не розробляючи проблем і нічого, і тепер переходжуся від початку і пишу код, щоб вивчити різні аспекти матеріалу.
розум злочину

@mindcrime звучить чудово! Радий, що можу допомогти.

5

Дивіться трикутник Паскаля .

Ймовірність результатів розгортання монети представлена ​​цифрами в нижньому рядку. Результат рівних головок і хвостів - середнє число. У міру того, як дерево росте більшим (тобто, більше перевертається), середнє число стає меншою часткою від суми нижнього ряду.


1

Можливо, це допомагає окреслити, що це пов'язано із законом про дуги. Це говорить про те, що для одного шляху результатів ймовірність того, що цей шлях залишається більшу частину часу в позитивній чи негативній області, значно вища, ніж те, що він йде вгору і вниз, ніж ви очікуєте від інтуїції . Ось декілька посилань:

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://en.wikipedia.org/wiki/Arcsine_law


1

У той час як відношення головок до хвостів сходить до 1, діапазон можливих чисел стає ширшим. (Я складаю цифри). Скажіть, на 100 кидків вірогідність 90%, що у вас від 45% до 55%. Це на 90%, що ви отримуєте від 45 до 55 голів. 11 можливостей для кількості голів. Близько 9% приблизно, що ви отримуєте рівну кількість голів і хвостів.

Скажіть, що для 10 000 кидків вірогідність 95%, що ви отримаєте від 49% до 51%. Тож співвідношення наблизилось до 1. Але тепер у вас від 4 900 до 5100 голів. 201 можливості. Шанс рівних чисел становить приблизно приблизно 0,5%.

І при мільйоні кидків ви впевнені, що маєте між 49,9% і 50,1% головами. Це діапазон від 499 000 до 501 000 голів. 2,001 можливості. Зараз цей шанс знижується до 0,05%.

Гаразд, математику склали. Але це повинно дати вам уявлення про "чому". Незважаючи на те, що співвідношення наближається до 1, кількість можливостей стає більшою, так що удари рівно на половину голови, наполовину хвостики стають все менш і менш імовірними.

Інший практичний ефект: Навряд чи на практиці у вас є монета, де ймовірність кинути голови рівно 50%. Це може бути 49,99371%, якщо у вас дійсно гарна монета. Для невеликої кількості кидків це не має значення. Для великої кількості відсоток голів збільшиться до 49,99371%, а не до 50%. Якщо кількість кидків буде досить великою, кидати 50% і більше головок стане дуже, дуже малоймовірним.


0

Ну, одна річ, зауважимо, що при парній кількості флісів (інакше ймовірність рівних голінь і хвостиків перевертається, звичайно, дорівнює нулю), найімовірнішим результатом завжди буде той, у якого рівно стільки головок перевертається, скільки хвостики обертаються.

Розподіл обертів задається коефіцієнтами многочлена Тож для рівних ймовірність дорівнює ( 1 + xnn p n = 2 - n ( n

(1+x2)n.
n
pn=2n(nn/2).

Використання наближення Стірлінга для, ви отримаєте щось на зразок з можливістю точно голів (і відповідно хвостиків) перевернути для загальних оборотів. Таким чином, абсолютна ймовірність цього результату сходить до 0, але набагато повільніше, ніж у більшості інших результатів, при цьому крайній випадок, коли 0 голів (або, як варіант, 0 хвостів) перевертає .p 1n! n/2n2-n

p1πn/2
n/2n2n

2
Вашу відповідь можна було б покращити, ретельно визначивши величини у виразах. Що таке ? Що таке ? рnp
Sycorax каже, що повернеться до Моніки

0

Припустимо, ви перевернете монету двічі. Можливі чотири результати: HH, HT, TH та TT. У двох з них у вас однакова кількість голів та хвостів, тому існує 50% шансів, що ви отримаєте однакову кількість голів та хвостів.

Тепер припустимо, що ви переверніть монету в 4306,492,102 рази. Чи очікуєте ви 50-відсоткового шансу, що ви обмотаєтеся рівно 2,153,246,051 головами та 2,153,246,051 хвостами?


Ні, моя інтуїція підказала мені, що шанси отримати точну відповідність низькі, тільки тому, що кількість збільшується. Але я хотів імітувати це лише для підтвердження своєї думки. Коли я побачив, що це вийшло саме так, мене заінтригувало формальне обґрунтування, чому саме так. Мені здається цікавим те, що отримане співвідношення збігається до 1, одночасно стає менш ймовірним, що буде рівно 1.
mindcrime

3
Один із способів думати про це полягає в тому, що для великих існує набагато більше способів бути близькими до 50-50, ніж для малих . nnn
Даніель МакЛаурі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.