Як називається статистична помилка, за якою результати попередніх обертів монети впливають на переконання щодо наступних обертів монет?


28

Як ми всі знаємо, якщо ви перевернете монету, яка має однакові шанси на посадку голови, як і хвости, то якщо ви перевернете монету багато разів, вдвічі ви отримаєте голови та половину часу отримаєте хвости.

Обговорюючи це з другом, вони сказали, що якщо ви перевернете монету 1000 разів, і дозвольте сказати, що перші 100 разів вона висадила голови, то шанси висадити хвіст збільшилися (логіка полягає в тому, що якщо вона буде неупереджена, то до моменту, коли ви перевернете її в 1000 разів, у вас буде приблизно 500 голів і 500 хвостів, тому хвости повинні бути більш імовірними).

Я знаю, що це помилка, оскільки минулі результати не впливають на майбутні результати. Чи є назва саме цієї помилки? Також, чи є краще пояснення, чому це помилково?


8
Якщо ви перевернете монету в 100 разів і вона приземлиться в 100 разів, шанси на те, що це не неупереджена монета.
Роберт

1
@Robert Як так? Оскільки кожен фліп не залежить від іншого, шанс того, що він буде H 100x, такий самий, як якщо б це була невідповідна послідовність H&T, або 100x T
юріцукі

11
@thinlyveiledquestionmark Я хотів би пограти з тобою в покер ... але тільки в тому випадку, якщо мені дозволять мати справу. Я думаю, що Роберт означає, що реалізація 100 H у 100 випробуваннях змістить його переконання від справедливості монети до несправедливої ​​монети. Враховуючи ці дані 100 H у 100 випробуваннях, вам доведеться володіти дуже сильним рівнем на Pr(H) щоб не помітно змістити задній.
Sycorax каже, що поверніть Моніку

5
@thinlyveiledquestionmark Ви повинні бути обережними. З огляду на незалежні фліпи, кожна 100-фліп-послідовність H або T однаково вірогідна: 100H так само, як 50H 50T, так само, як HTHTHTHT ... HT і так далі. Але набагато менше шансів отримати 100 H, ніж отримати загалом 50 голів, тому що існує 1029 різних способів, щоб 50 обертів піднімали голови і 50 обертів піднімали хвости.
Lagerbaer

3
Ідея Роберта цілком справедлива і в першу чергу може стати джерелом «помилок». Наші мізки є провідними в байєсівському, а не в часті. "Досконала" інформація, така як "абсолютно справедлива монета", рідко існує в природі. Таким чином, 100 голів на 100 спроб практично приведуть нас до думки, щоP(Heads)>0.5
PA6OTA

Відповіді:



32

Перше речення цього питання містить ще одну (споріднену) помилковість:

"Як ми всі знаємо, якщо ви перекинете монету, яка має рівний шанс посадити голови, як це робить хвости, то якщо ви перевернете монету багато разів, вдвічі ви отримаєте голови і половину часу отримаєте хвости ".

Ні, ми цього не отримаємо, ми не отримаємо голови вдвічі і хвости половини часу. Якби ми цього досягли, то Азартник врешті не помилився б . Математичний вираз для цього словесного висловлювання такий: для деяких "великих" (але скінченних) маємо , де, очевидно, позначає число раз монета сідає головами. Оскільки є кінцевим, то також є кінцевим і відмінним значенням від . Отже, що станеться після того, як зроблений фліп ? Або приземлилися головами, або ні. В обох випадкахnnh=n2nhnn+1nn+1nh щойно перестав бути рівним "половині кількості кидок".

Але, можливо, те, що ми насправді мали на увазі, було "немислимо великим" ? Тоді ми заявляємоn

limnnh=n2

Але тут RHS ("правий бік") містить який LHS ("лівий бік") перейшов до нескінченності. Отже, RHS - це також нескінченність, і тому, що це твердження говорить, це те, що кількість разів, коли монета приземлиться головами, дорівнює нескінченності, якщо ми кидаємо монету нескінченну кількість разів (поділ на незначне):n2

limnnh=n2=

Це по суті правильне, але марне твердження , і явно не те, що ми маємо на увазі.

Загалом, висловлення у питанні не відповідає, незалежно від того, вважається "загальний кидок" обмеженим чи ні.

Можливо, тоді ми повинні заявити

limnnhn=12?

По-перше, це означає "Відношення кількості посаджених голів до загальної кількості кидок, як правило, до значення коли кількість кидків тягнеться до нескінченності", що є іншим твердженням - немає "половини від загальної кількості кидків" тут. Крім того, саме так і досі сприймається ймовірність - як детермінований межа відносних частот. Проблема цього твердження полягає в тому, що він містить у LHS невизначену форму: і чисельник, і знаменник переходять у нескінченність. 1/2

Гммм, введемо арсенал випадкової змінної . Визначте випадкову змінну як прийняття значення якщо -й викид підійшов до голови, якщо він підійшов до хвостів. Тоді у нас є Xi1i0

nhn=1ni=1nXi

Чи можемо ми зараз принаймні заявити

limn1ni=1nXi=12?

Ні . Це детермінований межа. Це допускає всі можливі реалізації послідовності -х, і це навіть не гарантує існування межі, не кажучи вже про те, що вона дорівнює . Насправді таке твердження можна розцінювати лише як обмеження послідовності, і це знищило б незалежність кидів.X1/2

Що ми можемо сказати, це те, що ця середня сума вірогідно ("слабко") сходиться до (Бернуллі - слабкий закон великих чисел),1/2

limnPr(|1ni=1nXi12|<ε)=1,ε>0

і у випадку, що розглядається, воно також зближується майже впевнено ("сильно") (Борель - Сильний закон великих чисел)

Pr(limn1ni=1nXi=12)=1,

Але це імовірнісні твердження про ймовірність, пов’язану з різницею між та , а не про межу різниці (яка згідно з помилковим твердженням повинна бути нульовою - і це не так). nh/n1/2nhnt

Справді, потрібні певні інтелектуальні зусилля, щоб реально зрозуміти ці два твердження, і наскільки вони відрізняються («теорією» та «практикою») від деяких попередніх - я ще не претендую на таке глибоке розуміння для себе.


1
Мабуть, один із найкращих, навчальних відповідей, які я читав за довгий час. Молодці.
Піт Манчіні

@AlecosPapadopoulos Я думаю, що це допомогло б відповісти, щоб укласти те, що ми можемо сказати, у формулу, як ви робили з помилковими формулюваннями. Я думаю, це щось на зразок \ lim P (\ frac {1} {n} \ sum X_i) = 1?
kutschkem

@kutschkem Відмінна пропозиція. Просто зробив.
Алекос Пападопулос

12

Ця помилка має багато назв.

1) Це, мабуть, найвідоміше як помилковість Азартного гравця

2) його також іноді називають « законом малих чисел » (також дивіться тут ) (тому що це стосується ідеї, що характеристики популяції повинні відображатися в малих вибірках) - що, на мою думку, є чіткою назвою за його контраст із законом великої кількості, але, на жаль, те саме ім'я застосовується до розповсюдження Пуассона (а також іноді використовується математиками для того, щоб знову означати щось інше), так що це може бентежити.

3) серед людей, які вважають помилковість, її іноді називають « законом середніх показників », який, зокрема, має бути застосований після пробігу без певного результату, щоб стверджувати, що результат «належний», але, звичайно, немає такого короткострокового періоду Закон існує - ніщо не може «компенсувати» початковий дисбаланс - єдиний спосіб усунення початкової невідповідності - це обсяг пізніших значень, які самі по собі мають середнє значення 1/2 .

Розгляньте експеримент, в якому справедлива монета кидається неодноразово; нехай - кількість голів, а - кількість хвостів, що спостерігаються до кінця -го випробування. Зауважте, щоHiTiii=Hi+Ti

Цікаво зауважити, що в перспективі (тобто ), тоді як вірогідно сходиться до ,росте зі збільшенням - справді росте без зв’язку; немає нічого "відштовхувати його назад до 0".nHnn12E|HnTn|n


1

Ви думаєте про «стохастичне»? Обертання справедливої ​​монети (або рулон справедливої ​​матриці) є стохастичним (тобто незалежним) у тому сенсі, що воно не залежить від попереднього перевертання такої монети. Якщо припустити, що факт монети було перевернуто сто разів зі сто головами, це не змінює того факту, що наступний фліп має 50/50 шансів стати головою.

Навпаки, ймовірність витягнути певну карту, яка витягує карту з колоди карт без заміни, не є стохастичною, оскільки ймовірність витягнути певну карту змінить ймовірність витягнути карту на наступному розіграші (якщо це було із заміною, це було б стохастично).


стохастичний не означає самостійний
Бен Войгт

1
"Якщо припустити, що справедливий конфлікт ... наступний фліп має 50/50 шансів стати головою" , я думаю, у вас тут є глибока філософська правда. Ви можете розширити відповідь, щоб пояснити, що трапиться, якщо це несправедливий (AKA регулярний?) Конф.
Гайд

0

Додавши відповіді Glen_b та Alecos, давайте визначимо, що буде кількістю голів у перших випробуваннях. Знайомий результат, що використовує нормальне наближення до двочлена, - приблизно . Тепер, перш ніж спостерігати за першими 100 закидами, ваш друг правильний, що є хороший шанс, що буде близько 500. Насправді,XnnXnN(n/2,n/4)X1000

P(469<X1000<531).95 .

Однак, спостерігаючи , давайте визначимо числом голів в останніх 900 випробуваннях, тодіX100=100Y900

P(469<X1000<531X100=100)=P(369<Y900<431).1

оскільки приблизно .Y900N(450,15)

Таким чином, після спостереження 100 голів у перших 100 випробуваннях більше не існує великої ймовірності спостерігати близько 500 успіхів у перших 1000 випробуваннях, якщо, звичайно, припускати, що монета є справедливою. Зауважимо, що це конкретний приклад, що ілюструє, що початковий дисбаланс навряд чи буде компенсований у короткостроковому періоді.

Далі зауважте, що якщо , тоn=1,000,000

P(499,020<X1,000,000<500,980).95

але вплив дисбалансу в перших 100 кидках незначно з часом

P(499,020<X1,000,000<500,980X100=100)=P(498,920<Y999,900<500880).949


0

Ви замислюєтесь на помилковості Комара , хоча це не зовсім правильно.

Дійсно, якщо висловити фразу як "з припущеною справедливою монетою і спостерігати за заданою послідовністю результатів, яка є оцінка елементарних ймовірностей монети", це стає більш очевидним.

Дійсно, « помилковість » пов'язана лише з (припущеними) справедливими монетами, де різні продукти випробувань рівні. Однак це тягне за собою інтерпретацію, яка на відміну від (вивчення) подібних випадків з монетою, що має інше (несиметричне / упереджене) розподіл ймовірностей.

Для подальшого обговорення цього (і невеликого повороту) дивіться це питання .

Це саме як помилковість, що використовується в багатьох статистичних дослідженнях, де кореляція передбачає причинність . Але це може бути натяком на причинно-наслідкові зв’язки або загальну причину.


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.