Статистичний аргумент, чому 10 000 голів з 20 000 кидок свідчить про невірні дані


11

Скажімо, ми неодноразово кидаємо справедливу монету, і ми знаємо, що кількість головок і хвостів повинна бути приблизно однаковою. Коли ми бачимо такий результат, як 10 голів та 10 хвостів на загальну кількість 20 кидок, ми вважаємо результати та схильні вірити, що монета є справедливою.

Що ж, коли ви бачите такий результат, як 10000 голів та 10000 хвостів на загальну суму 20000 кидків, я насправді поставив би під сумнів достовірність результату (чи експериментатор підробив дані), оскільки я знаю, що це скоріше, ніж, скажімо, результат 10093 голови та 9907 хвостів.

Який статистичний аргумент стоїть за моєю інтуїцією?

Відповіді:


21

Якщо припустити справедливу монету, результат 10000 голів і 10000 хвостів насправді скоріше, ніж результат 10093 голів і 9907 хвостів.

Однак, коли ви говорите, що справжній експериментатор навряд чи отримає рівну кількість головок і хвостів, ви неявно посилаєтесь на теорему Байєса. Ваша попередня думка щодо реального експерименту полягає в тому, що Проб (кількість головок = 10000 в 20000 кидках | враховуючи, що експериментатор не підробляє) близький до 0. Таким чином, коли ви бачите фактичний результат, що "Без голови = 10000" ваш задній про Проб (експериментатор не підробляє | спостерігається результат 10000 голів) також близький до 0. Таким чином, ви робите висновок, що експериментатор підробляє дані.


Дуже добре пояснено! Який прекрасний приклад підходу теореми Байєса.
Тал Галілі

1
@Srikant: цього попереднього формально не можна визначити. У будь-якому випадку, Проб (кількість головок = X | експериментатор не підробляє) завжди знаходиться біля нуля, коли N = 20000, незалежно від значення X і незалежно від вашого попереднього. Тож ваша задня частина для будь-якого числа також завжди близька до 0. Я не бачу, що це стосується теореми Байєса.
Йоріс Майс

Все це у хлопця, якого причаїли, намагаючись довести бога, існувало. Елегантний, справді.
Брендон Бертелсен

1
Розглядаючи це в більш загальній перспективі, суть, з якою я згоден, полягає в тому, що тут працює теорема Байєса. Зокрема, існують альтернативні ймовірності (що відповідають різним генеративним процесам) для обману та для чесних експериментаторів. Встановлення обману - це задній висновок щодо інтуїтивного та, отже, жахливо не визначеного обману.
кон'югатприор

1
@Srikant @whuber: комбінатори ... ви праві. Я почав з єдиної ймовірності, яка в цьому випадку є безглуздою дурницею. Мій поганий
Йоріс Майс

12

Мені подобається пояснення Сріканта, і я думаю, що байєсівська ідея - це, мабуть, найкращий спосіб підійти до подібної проблеми. Але ось ще один спосіб побачити це без Байєса: (в R)

dbinom(10, size = 20, prob = 0.5)/dbinom(10000, 20000, 0.5)

що становить приблизно 31,2 в моїй системі. Іншими словами, в 30 разів більше шансів побачити 10 з 20, ніж 10 000 з 20 000, навіть у справедливій монеті в обох випадках. Це співвідношення зростає без обмежень у міру збільшення розміру вибірки.

Це свого роду підхід співвідношення ймовірності, але, знову ж таки, в моєму кишечнику це відчуває, що байєсівський суд закликає більше, ніж усе інше.


Чому співвідношення? Чому б не просто сказати, що ймовірність цього точного розіграшу надзвичайно низька?
Енді Ш

5
Твердження про те, що певна ймовірність є недостатньою для контексту, не є переконливим. Ймовірність того, що я точно такий же високий, як і мій зріст (що б там не було), дорівнює нулю. І, так, навіть важко визначити висоту з нескінченною точністю, яда, яда, яда ... Моя думка полягає в тому, що віра існування відбивається від подій безмежної ймовірності, що відбуваються весь час! 10 000 з 20 000 - поза контекстом - мене зовсім не дивує. Незалежно від того, якою може бути чисельна ймовірність.

9

Суб'єктивістів байесовский аргумент є практично єдиним способом (з точки зору статистики) ви могли б йти про розуміння вашої інтуїції , яка - власне кажучи - питання про проведення психологічного дослідження, а НЕ статистичні один. Однак, явно несправедливо - і тому недійсно - використовувати баєсовський підхід, щоб стверджувати, що слідчий підробив дані. Логіка цього ідеально кругла: воно зводиться до того, щоб сказати, "грунтуючись на моїх попередніх переконаннях про результат, я вважаю ваш результат неймовірним, і тому ви, мабуть , обдурили". Такий нелогічний корисливий аргумент, очевидно, не протистоятиме ні в залі суду, ні в процесі експертної перевірки.

α= 5% рівень розглядав би будь-який результат між 9 996 та 10 004 як підозрюваний, оскільки (а) ця колекція близька до наших гіпотезованих "підроблених" результатів та (б) під нікчемною гіпотезою про відсутність фальшивок (невинних, поки не буде доведено вину у суді!) , результат у цьому діапазоні має лише 5% (фактично 5.07426%) шанс виникнення. Крім того, ми можемо поставити цей, здавалося б, ad hoc підхід у контексті хі-квадрата (а-ля Фішер), просто порівнюючи відхилення між спостережуваною пропорцією і очікуваною пропорцією, а потім посилатися на лемму Неймана-Пірсона в односхилому тесті низький хвіст і застосовуючи нормальне наближення до розподілу біномів .

Хоча такий тест не може довести фальсифікацію, він може бути застосований до майбутніх звітів цього експериментатора, щоб оцінити правдоподібність їхніх тверджень, не роблячи несприятливих і непідтверджених припущень, заснованих на вашій інтуїції. Це набагато справедливіше і суворіше, ніж звертатися до байєсівського аргументу, щоб в’язати когось, хто може бути абсолютно невинним і просто трапився таким нещасливим, що вони отримали прекрасний експериментальний результат!


5

Я думаю, що ваша інтуїція є хибною. Здається, ви неявно порівнюєте один, "особливий" результат (рівно 10000 голів) з набором безлічі результатів (усі "неспеціальні" числа голів близькі до 10000). Однак визначення "особливого" - це довільний вибір, заснований на нашій психології. Як щодо двійкових 10000000000000 (десяткової 8192) або Hex ABC (десяткової 2748) - це також буде підозріло особливим? Як коментує Йоріс Мейс, аргумент Байєса був би по суті однаковим для будь-якої однієї кількості голів, маючи на увазі, що кожен результат буде сумнівним.

Щоб трохи розширити аргумент: ви хочете перевірити гіпотезу ("експериментатор підробляє"), а потім вибираєте тестову статистику (кількість головок). Тепер, чи підходить ця тестова статистика, щоб розповісти щось про вашу гіпотезу? Мені здається, обрана тестова статистика не є інформативною (не є функцією параметра, визначеного як фіксоване значення в гіпотезі). Це повертається до питання, що ви маєте на увазі під "обманом". Якщо це означає, що експериментатор контролює монету за бажанням, то це не відображається в тестовій статистиці. Я думаю, що вам потрібно бути більш точним, щоб знайти кількісно вимірюваний показник, і, таким чином, зробити питання придатним до статистичного тесту.


+1, Але я не переконаний. Що особливо 10 000, це те, що він точно дорівнює очікуваній кількості голів за гіпотезою, що монета є справедливою. Цей факт не залежить від будь-якої психології чи системи представлення чисел. Аналіз у цій відповіді може дати деяке уявлення про ситуацію, коли, скажімо, було перевернуто 20 005 монет і відмічено 10 000 голів (і, отже, 10 005 хвостів), а чиясь «інтуїція» запропонувала факери.
whuber

Я повністю погоджуюся, що - як ви зазначаєте у своїй відповіді - все залежить від апріорного визначення гіпотези: якщо ви заздалегідь визначите, що підробляючи експеримент, ви маєте на увазі досягнення результату для кількості голів, тобто близьке до очікуваного значення ", то це основа для статистичного тесту з" кількістю голів "як тестової статистики. Однак без такого апріорного уточнення значення "підробка" та "особливе значення для кількості голів" залишаються мутними, і незрозуміло, що вони мають стосунки один до одного.
каракал

4

Висновок, який ви робите, буде ДУЖЕ залежним від попереднього вибору ймовірності обману та попередньої ймовірності того, що, враховуючи, що фліппер бреше, повідомляються х голови.

Надання найбільшої маси на P (10000 голів, що повідомляються | лежачи), на мою думку, трохи не інтуїтивно зрозуміло. Якщо репортер не є наївним, я не можу уявити, щоб хтось повідомляв про подібні фальсифіковані дані (значною мірою з причин, про які ви згадали в первісному дописі; це занадто підозріло для більшості людей). фальсифіковані дані, то я вважаю, що більш розумним (і дуже приблизним) до попередніх результатів може бути дискретна рівномірність до P (X голів, що повідомляються | лежачи) = 1/201 для цілих чисел {9900, ..., 10100} і P (x головки, про які повідомляється | лежачи) = 0 для всіх інших x. Припустимо, ви вважаєте, що попередня ймовірність брехні становить 0,5. Тоді деякі задні ймовірності:

P (лежачи | 9900 голів, що повідомляються) = P (лежачи | 10100 голів, повідомлено) = 0,70;

P (лежачи | 9950 голів повідомляється) = P (лежачи | 10050 голів повідомляється) = 0,54;

Р (лежачи | 10000 голів повідомляється) = 0,47.

Більшість розумних кількостей повідомлених голів із справедливої ​​монети призведе до підозри. Тільки щоб показати, наскільки чутливими є задні ймовірності до ваших пріорів, якщо попередня ймовірність обману знизиться до 0,10, то задні ймовірності стають:

P (лежачи | 9900 голів, що повідомляються) = P (лежачи | 10100 голів, що повідомляються) = 0,21;

P (лежачи | 9950 голів, що повідомляються) = P (лежачи | 10050 голів, що повідомляються) = 0,11;

Р (лежачи | 10000 голів, повідомлено) = 0,09.

Тому я думаю, що оригінал (і високо оцінений відповідь) можна було б трохи розширити; ні в якому разі не слід робити висновок, що дані підроблені, не ретельно враховуючи попередню інформацію. Крім того, думаючи про це інтуїтивно, здається, що на задню ймовірність брехні, швидше за все, впливатиме попередня ймовірність брехні, а не попередній розподіл голів, про який повідомляється, враховуючи, що фліппер бреше (крім пріорів, які ставлять усіх їхня маса на невеликій кількості голів, про які повідомляється, що фліппер бреше, як у моєму прикладі.)


Я думаю, що це дуже гарна відповідь, але я не згоден з вашим другим абзацом. Я не думаю, що початкова умовна ймовірність Шріканта є протиінтуїтивно зрозумілою, і просто тому, що відповісти на це важко, це не аргумент проти цього. Я також не думаю, що ваша однакова ймовірність лежати в межах від 9900 до 10100 взагалі має сенс, хоча це корисно для демонстраційних цілей.
Енді Ш

2

Для пояснення Байєса потрібен попередній розподіл ймовірностей за повідомленими результатами за допомогою лежачої монети ласти, а також попередня ймовірність брехні. Коли ви бачите значення, яке є набагато більш імовірним при лежачому розподілі, ніж випадкове перевертання, це робить вашу задню ймовірність брехні набагато вищою.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.