Регресія в середньому проти помилковості гравця


29

З одного боку, у мене середній регрес, а з іншого - помилковість гравця .

Помилковість Гамблера визначається Міллером і Санджурьо (2019) як "помилкова віра в те, що випадкові послідовності мають систематичну тенденцію до розвороту. Час підряд вважатиметься непропорційно ймовірним, що впаде хвости на наступному випробуванні.

Я мав гарну результативність в останній грі, і, відповідно до регресу, мабуть, у наступній грі я матиму гірший результат.

Але відповідно до помилковості азартного гравця: Розгляньте наступні дві ймовірності, припускаючи справедливу монету

  1. ймовірність 20 голів, то 1 хвіст =0,520×0,5=0,521
  2. ймовірність 20 голів, то 1 голова =0,520×0,5=0,521

Потім...

Розглянемо простий приклад: Клас учнів приймає 100-предметний істинний / хибний тест з предмету. Припустимо, що всі студенти обирають випадковим чином з усіх питань. Тоді оцінка кожного учня буде реалізацією однієї сукупності незалежних і однаково розподілених випадкових величин із очікуваним середнім значенням 50.

Звичайно, деякі студенти випадково наберуть значно вище 50, а деякі значно нижче 50. Якщо можна взяти лише 10% студентів, які набрали найбільшу оцінку, і повторно здають їм тест, на якому вони знову обирають випадковим чином по всіх предметах, середній бал, як очікується, знову буде близько 50.

Таким чином, середнє значення цих студентів буде «регресувати» аж до середнього рівня для всіх студентів, які склали оригінальний тест. Незалежно від того, що студент набрав на оригінальному тесті, найкращий прогноз їх балів на другому тесті - 50.

У спеціальному випадку, якщо хтось забирає лише 10% студентів, які набрали найбільшу кількість балів, і дає їм другий тест, на якому вони знову обирають випадковим чином по всіх предметах, середній бал, як очікується, знову буде близько 50.

Відповідно до помилок азартних гравців, чи не слід очікувати такої ж ймовірності для забивання, а не обов'язково, швидше, до 50?

Міллер, Дж. Б. та Санджурьо, А. (2019). Як досвід підтверджує помилковість гравця, коли розмір вибірки нехтується.


5
Я не бачу, як помилка Комара пов'язана з двома ймовірностями, які ви обчислюєте. Не могли б ви пояснити точніше, чим ви розумієте цю помилку?
whuber

Ваша гра має найдовшу послідовність головок?
АдамО

1
Я б дуже хотів пояснення цьому. На сьогодні відповіді, здається, ще не прояснили мене. Регресія до середнього значення робить незалежними події залежними. Можливо, регресія до середнього не може бути використана лише для одного спостереження, вона застосовується лише тоді, коли є середня.
icc97

Відповіді:


28

Я думаю, що плутанину можна вирішити, враховуючи, що поняття "регресія до середнього" насправді не має нічого спільного з минулим. Це лише тавтологічне спостереження, що при кожній ітерації експерименту ми очікуємо середній результат. Отже, якщо раніше у нас був результат вище середнього, тоді ми очікуємо гіршого результату, або якщо у нас був результат нижче середнього, ми очікуємо кращого. Ключовим моментом є те, що саме очікування не залежить від будь-якої попередньої історії, як це стосується помилок азартних гравців.


Саме так. У контексті цього Q, якщо голови можна трактувати як "хороший результат", то в прикладах ОП, швидше за все, настане гірший результат після ряду хороших результатів, а кращий результат, ймовірно, настане після ряду поганих результатів .
амеба каже, що повернеться до Моніки

5
Схоже, ти собі суперечить. Ви заявляєте the expectation itself does not depend on any previous historyі if we previously had an above average outcome then we expect a worse result. Ви вживаєте слово очікувати в обох місцях і говорите про минулу / попередню історію в обох місцях.
Ерік

6
Суперечності немає. Ми не очікуємо гіршого результату, оскільки результати насправді залежать один від одного, ми очікуємо гіршого результату, тому що ми побачили той, який був вище наших очікувань. Саме очікування є постійним і не змінюється в результаті бачення попереднього результату.
dsaxton

@Erik Можливо, переформатування може допомогти, але важливо зазначити, як диференціювати два аспекти. По-перше, ми очікуємо середній результат, а точніше віримо в це найімовірніше. Якщо порівнювати з фактичним результатом, це очікування може бути відносно добрим чи поганим залежно від того, наскільки хороший чи поганий цей результат був відносно наших очікувань. Ми не отримуємо ніякої інформації про майбутнє! Ми лише порівнюємо фактичні результати з середніми. (Цей коментар зараз зайвий, але я залишаю його)
весілля

9
Не вимагаючи, тому що ваша відповідь страждає від неоднозначності, яка спонукала це питання в першу чергу. А саме, що таке "гірший" результат після вище середнього результату? ОП трактує це як "гірше середнього" (тлумачення, яке інтуїтивно почувається правильним через помилки справедливого світу), тоді як регрес до середнього означає, що він буде "гіршим за історію". Без усунення цього джерела плутанини ваша відповідь (правильна) зрозуміла лише тим, хто вже знає правильну відповідь. Якщо ви відредагуєте його в якійсь формі, ви отримаєте мою нагороду.
румчо

17

Якби ви опинилися в такій позі, як раціональна людина (і припускаючи чесну монету), найкращим варіантом було б просто здогадуватися. Якби ви опинилися в такій позиції, як забобонний азартний гравець, найкращим варіантом було б поглянути на попередні події та спробувати виправдати свої міркування про минуле - напр. "Ух, голови горячі , час розкусити!" або «Там немає ніякого способу , яким ми будемо бачити ще голови - ймовірність такого роду смугу неймовірно низько!».

Помилковість азартного гравця не усвідомлює, що кожна конкретна струна з 20 монет кидає нас шалено навряд чи - наприклад, дуже навряд чи перевернути 10 голів, а потім 10 хвостиків, дуже навряд чи перевернути чергуються голови та хвости, дуже навряд чи розколоться на 4-х та ін. . Навіть дуже неправдоподібно перевернути HHTHHTTTHT .. тому що для будь-якого рядка існує лише один спосіб, щоб це відбулося з багатьох різних результатів . Таким чином, зарахування будь-якого з них як "вірогідного" або "малоймовірного" є помилкою, оскільки всі вони є безперечними.

Регресія в середньому - це правильно обгрунтоване переконання, що в перспективі ваші спостереження повинні сходитися до кінцевого очікуваного значення. Наприклад, я можу зробити ставку на те, що 10 з 20 монет кидає - це добре, тому що існує багато способів цього досягти. Ставка на 15 з 20 істотно менша, оскільки існує набагато менше рядків, які досягають остаточного підрахунку. Варто зауважити, що якщо сидіти і перегортати (справедливі) монети досить довго, у кінцевому підсумку ви закінчите щось приблизно 50/50 - але у вас не вийде щось, що не має "прожилок" чи іншого малоймовірного події в ній. У цьому полягає суть різниці цих двох понять.

TL; DR : Регресія в середньому говорить про те, що з часом ви отримаєте розподіл, який відображає очікуване в будь-якому експерименті. Помилковість азартного гравця (помилково) говорить про те, що кожен окремий фліп монети має пам'ять щодо попередніх результатів, що має вплинути на наступний незалежний результат.


1
То чи помилка азартного гравця - це неправильна концепція? Я не міг отримати суть цього. Вибачте
Луїс П.

6
Помилковість азартного гравця - це .. ну .. помилковість. Це неправильно, це погані міркування. Однак середній регрес - це чиста статистика :)
Дерек Янні

1
Regression to the mean is the rightly-founded belief that in the long run, your observations should converge to a finite expected value- Те є «помилка гравця» - що після низки голів, хвостів тепер більш імовірно, тому , що з попутним монети було б сходилися ...
Izkata

2
@Izkata Не зовсім. Регресія в середньому означає, що при великій кількості випробувань, смуги з обох боків повинні приблизно вирівнюватися, і чим більше випробувань, тим ближче до справжнього значення, яке ви отримуєте. Якщо ви перевернули достатньо, щоб отримати смугу в 100 голів, у вас, ймовірно, є також смуги хвостів, щоб збалансувати її десь у вашому розповсюдженні, оскільки смуги голови та хвости однаково ймовірні. Важливо, що регресія до середнього значення не передбачає припущень щодо будь-яких конкретних даних, лише щодо сукупних значень із збільшенням розміру вибірки.
Етан

1
Помилковість @Izkata Gambler заявляє про те, що станеться з певним результатом, регресія в середньому робить загальне твердження про те, чого ми очікуємо від багатьох результатів.
Дерек Янні

5

Я завжди намагаюся пам’ятати, що регресія до середнього не є компенсаційним механізмом спостереження за оточуючими.

Не існує жодних причинно-наслідкових зв’язків між тим, щоб провести видатний азартний пробіг, а потім пройти 50-50 після цього. Це просто корисний спосіб пам’ятати, що, вибираючи вибірку з розподілу, ви, швидше за все, бачите значення, близькі до середнього (подумайте, що тут має говорити нерівність Чебишева).


2
Так Чебишев! Чудова точка!
Дерек Янні

4

Ось простий приклад: ви вирішили кинути 200 монет. Поки ви кинули 100 з них, і вам дуже пощастило: на 100% підійшли голови (неймовірно, я знаю, але давайте просто все буде просто).

За умови 100 головок у 100 перших кидках, ви очікуєте, що в кінці гри будете мати 150 голів. Надзвичайним прикладом помилковості азартного гравця буде думати, що ви все одно очікуєте лише 100 голів загалом (тобто очікувану величину перед початком гри), навіть після отримання 100 в перших 100 кидках. Гравець помилково вважає, що наступні 100 кидок повинні бути хвостами. Прикладом регресу до середнього значення (у цьому контексті) є те, що очікується, що ваш 100-відсотковий темп руху знизиться до 150/200 = 75% (тобто до середнього рівня 50%), коли ви закінчите гру.


1
@whuber це не класичний приклад висоти батьків і синів, але я б стверджував, що це відповідає визначенню вікіпедії: "регресія до (або до) середнього - це явище, що якщо змінна (наприклад, голова фракції під час монети]] крайній за своїм першим вимірюванням, він буде, як правило, наближатися до середнього значення за його другим вимірюванням "
Адріан

3
Будьте обережні з Вікіпедією: вступна мова призначена лише для того, щоб дати деяку евристичну думку, але це рідко є визначенням. Ваша цитата насправді не є ані визначенням (оскільки в ній не зазначено, що означає "крайність"), ані в більшості інтерпретацій. Наприклад, для будь-якої неперервної випадкової величини є рівно ймовірність того, що другий з двох незалежних випробувань це додатково від середнього значення , ніж перший. 1/2
whuber

1
Я думаю, що надання чіткого опису хибності гравця та регресії середнього значення може бути важливішим, ніж наведення прикладів. Коли наведено лише приклади, незрозуміло, як їх слід розуміти чи як вони стосуються цих двох предметів.
whuber

1
Як хтось, хто мислить аналогічно ОП, ваш другий абзац - єдиний приклад у всіх відповідях, який чітко пояснює, у чому різниця. Тепер це має більше сенсу.
Ізката

1
@whuber Це саме те, що робить більшість інших відповідей, і для мене це зовсім не з'ясувалося.
Ізката

2

Я можу помилитися, але я завжди вважав, що різниця полягає у здобутті незалежності.

У помилковості Азартного гравця питання полягає в нерозумінні незалежності. Впевнений, що за велику кількість викинутих монет ви будете приблизно 50-50 розколів, але якщо випадково ви цього не зробите, думка, що наступні T кидання допоможуть вирівняти шанси, неправильна, тому що кожен кидок монети не залежить від попередній.

Регресія до середини - це те, де я бачу, що вона використовується, якась ідея, що нічия залежать від попередніх малюнків або попереднього обчисленого середнього / значення. Наприклад, нехай використовується відсоток зйомки в НБА. Якщо гравець "А" зробив в середньому 40% своїх пострілів протягом своєї кар'єри і розпочав новий рік, вистріливши 70% у своїх перших 5 іграх, розумно думати, що він буде регресувати до середнього рівня в кар'єрі. Існують залежні фактори, які можуть і впливатимуть на його гру: гарячі / холодні смуги, гра в команді, впевненість і простий факт, що якби він підтримував 70% зйомки протягом року, він абсолютно знищив би кілька записів, які просто неможливі фізичні подвиги (за існуючих можливостей професійних гравців у кошик). Коли ви граєте більше ігор, відсоток стрілянини, ймовірно, знизиться до середнього рівня в кар’єрі.


Ваше пояснення регресу до середнього звучить більше як оцінка усадки. Чи могли б ви дати конкретні визначення того, що ви насправді маєте на увазі під «регресією»?
whuber

Я дотримувався ідеї "Феномен виникає тому, що бали учнів визначаються частково за основними можливостями, а частково випадково" з Вікіпедії. Я розумію, що поки існує рівень вірогідності, результати визначаються деякою базовою здатністю.
Марсенау

2
Дякую за роз’яснення. Не очевидно, як ця ідея застосовується до ідеї, що в міру розвитку кар'єри середнє значення наближається до середнього рівня кар'єри. Це звучить або як тавтологія, або якась версія закону великої кількості. Насправді це звучить жахливо, як сама помилка Комара!
whuber

1
Або середній показник вашої кар’єри зросте, щоб задовольнити ваші нові здібності. :) Я думаю, що помилково каламутити воду неймовірним вмінням.
Ерік

1
"нерозуміння незалежності" - це, здається, є критичним моментом. Регресія до середнього значення робить незалежними події залежними.
icc97

2

Ключовим є те, що ми не маємо ніякої інформації, яка допомогла б нам у наступній події (помилковість азартних гравців), оскільки наступна подія не залежить від попередньої події. Ми можемо обґрунтувати здогадки про те, як пройде серія випробувань. Ця обґрунтована здогадка - це середній приблизно наш очікуваний середній результат. Отже, коли ми спостерігаємо відхилення середньої тенденції назад до середньої, з часом / випробувань, то ми спостерігаємо регрес до середнього.

Як можна помітити, що регрес до середнього значення - це спостережувана серія дій , це не є передбачувачем. Оскільки проводиться більше випробувань, все буде більш наближеним до нормального / гауссового розподілу. Це означає, що я не роблю жодних припущень і не здогадуюсь про те, яким буде наступний результат. Використовуючи закон великої кількості, я можу теоретизувати, що, хоча речі можуть рухатися в один бік в даний час, з часом все вирівняється. Коли вони самі балансують, набір результатів регресував до середнього. Тут важливо зазначити, що ми не кажемо, що майбутні випробування залежать від минулих результатів. Я просто спостерігаю за зміною балансу даних.

У помилка гравця , як я розумію , що це більш безпосереднє в його цілі і спрямована на передбачення майбутніх подій. Це відстежує те, що забажає азартний гравець. Зазвичай ігрові випадки тривалий час нахиляються до азартних гравців, тому гравець хоче знати, яким буде наступне випробування, оскільки вони хочуть скористатися цими знаннями. Це призводить до того, що азартний гравець помилково припускає, що наступне випробування залежить від попереднього випробування. Це може призвести до нейтрального вибору типу:

Останні п'ять разів колесо рулетки приземлялося на чорному, тому наступного разу я ставлю великі на червоне.

Або вибір може бути корисним:

Останні 5 рук я отримав повний дім, тому я ставлюсь на великі ставки, тому що я на виграшній смузі і не можу програти.


Отже, як ви бачите, є кілька ключових відмінностей:

  1. Регресія в середньому не передбачає, що незалежні випробування залежать від помилковості гравця.

  2. Регресія в середньому застосовується для великої кількості даних / випробувань, коли помилка гравця стосується наступного випробування.

  3. Регресія до середнього описує те, що вже відбулося. Помилковість Габблера намагається передбачити майбутнє на основі очікуваного середнього та минулих результатів.


1
Насправді я не думаю, що регресія до середнього значення не має нічого спільного із законом великих чисельності, або це означає, що ви говорите, що це робить у першому реченні.
амеба каже, що повернеться до Моніки

@amoeba, тож якщо ми плануємо перевернути монету в 100 разів, а 20 проб у пробі, у нас буде 20 голів. Наприкінці судового процесу у нас 55 голів. Я намагаюся сказати, що це був би приклад "регресу в середньому". Він почався з одностороннього, але з часом він нормалізувався. Закон великої кількості біт був ще одним способом висловлення думки про те, що все вийде в середньому за достатньо випробувань, це те саме, що сказати, що початковий дисбаланс буде врівноважуватися з часом або регресувати до середнього.
Ерік

1
Я здогадуюсь, я починаю отримувати суть цих тем за допомогою ваших клавіш, Еріку. Гарний! :) xxx
Луїс П.

2

Чи студенти з вищими класами, які гірше оцінюються на шахраїв, які перевіряють тестування?

Запитання отримало істотну редакцію після останньої з шести відповідей.

100

Або вони повинні просто триматися подалі від колеса рулетки?

50%50%10050

60%2.8%30006085

8560%50%10060%2.8%2852.8%8560%

50%1005050

Пощастило монет і пощастило сальто

100055%Г100045%Б1000Ж) і випадковим чином розподілити їх. Це аналогічно припущенню вищої та нижчої здатності / знань під час тесту з прикладу, але легше правильно міркувати про неживих об'єктах.

(551000+451000+501000)/3000=5060%18.3%0,2%2.8%60%7.1%60%21

2160%50%10086%=18.3%/(18.3%+0,2%+2.8%)1%=0,2%/(18.3%+0,2%+2.8%)13%86%55+1%45+13%50=54.251006050

Тож навіть коли деякі монети кращі за інші, випадковість монети перевертає означає, що відбір найкращих виконавців з тесту все одно буде демонструвати деякий регрес до середнього значення на повторному тестуванні. У цій модифікованій моделі гарячість вже не є відвертою помилкою - забивши краще в першому раунді, це означає більш високу ймовірність мати гарну монету! Однак помилковість азартних гравців як і раніше залишається помилкою - тих, хто зазнав удачі, не можна очікувати, що вони будуть компенсовані невдачею при повторному випробуванні.


Я щойно отримав ідею. Я буду імітувати цю модель і подивитися, як вона працює.
Луїс П.

1

Вони говорять те саме. Вас здебільшого збентежили, оскільки жоден експеримент на прикладі гортання монети не має надзвичайного результату (H / T 50/50). Змініть це на "перегортання десяти ярмаркових монет одночасно в кожному експерименті", і азартні гравці хочуть все виправити. Тоді екстремальним вимірюванням буде те, що ти випадково бачиш, що всі вони - голови.

Помилка азартних гравців: трактуйте кожен результат азартної гри (результат гортання монети) як IID . Якщо ви вже знаєте розподіл цих IID-акцій, то наступне передбачення має виходити безпосередньо з відомого розподілу і не має нічого спільного з історичними (або майбутніми) результатами (так само, як і інші IID).

Регрес до середнього: ставляться до кожного результату тесту як до IID (оскільки студент вважає, що він здогадується випадковим чином і не має справжньої майстерності). Якщо ви вже знаєте дистрибуцію цих IID-акцій, то наступне передбачення виходить безпосередньо з відомого розподілу і не має нічого спільного з історичними (або майбутніми) результатами (так само, як і інші IID) ( так само, як і раніше ). Але, за CLT , якщо ви помітили екстремальні значення в одному вимірі (наприклад, випадково ви взяли вибірку лише в топ-10% студентів з першого тесту), ви повинні знати, що результат наступного спостереження / вимірювання все ще буде генерований з відомих розподіл (і, таким чином, більше шансів бути ближчим до середнього, ніж залишатися в крайності).

Отже, обидва кажуть, що наступне вимірювання відбуватиметься з розподілу замість минулих результатів.


Це неправильне цитування теореми про центральну межу. Це лише виклад того, що таке незалежна подія.
АдамО

0

Нехай X і Y - дві однорідні випадкові величини на [0,1]. Припустимо, ми спостерігаємо їх один за одним.

Хибність гравця: P (Y | X)! = P (Y) Це, звичайно, нісенітниця, оскільки X і Y незалежні.

Регресія до середнього значення: P (Y <X | X = 1)! = P (Y <X) Це правда: LHS дорівнює 1, LHS <1


0

Дякуючи вашим відповідям, я думаю, що я міг зрозуміти різницю між середньою регресією та помилкою гравця. Навіть більше, я створив базу даних, щоб допомогти мені проілюструвати «справжній» випадок.

Я вибудував таку ситуацію: я зібрав 1000 учнів і поставив їх, щоб зробити тест, випадково відповідаючи на запитання.

Тестовий бал становить від 01 до 05. Оскільки вони випадковим чином відповідають на запитання, тому кожен бал має 20% шансів на його досягнення. Тож для першого тесту кількість учнів із оцінкою 05 повинна бути чимось близькою до 200

10000,20

200

У мене було 196 учнів із оцінкою 05, що дуже близько до очікуваних 200 учнів.

Тому я ставлю тих 196 учнів, які повторюють тест, очікується 39 учнів із оцінкою 05.

1960,20

39

Ну, за результатами я отримав 42 студентів, що в межах очікуваного.

Для тих, хто отримав бал 05, я поставив їх повторити тест і так далі ...

Тому очікуваними цифрами були:

Очікуваний РЕТЕСТ 03

420,20

8

(3.3) Результати (8)

Очікуваний РЕТЕСТ 04

80,20

1,2

(4.3) Результати (2)

Очікуваний РЕТЕСТ 05

20,20

0,1

(4.3) Результати (0)

0,204

0,205=0,00032

0,000323500=1.2

Тому ймовірність того, що один студент отримує бал 05 у всіх тестах 05, не має нічого спільного з його останнім балом, я маю на увазі, я не повинен обчислювати ймовірність кожного тесту окремо. Я повинен шукати ці 05 тестів як одну подію і обчислити ймовірність цієї події.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.