Модифікована теорема Байєса XKCD: насправді якась розумна?


81

Я знаю, що це з коміксу, який відомий тим, що скористався певними аналітичними тенденціями , але насправді це виглядає обґрунтовано після кількох хвилин погляду. Чи може хтось окреслити для мене, що робить ця " модифікована теорема Байєса "?



50
@Tschallacka Чому ти вважаєш, що Рандалл це написав?
kasperd

16
@Tschallacka, якщо будь-хто з авторів не сам Рандалл, це не так.
SQB

Але чи не слід застосовувати теорему Байєса до P (C), щоб оновити її значення за рахунок більшої кількості доказів?
Якк

1
Я впевнений, що в є лише певне доповнення. P(C)
Іван Макдональд

Відповіді:


107

Ну, розподіляючи член , отримуємо який ми можемо трактувати як Закон сумарної ймовірності, застосований до події "ви правильно використовуєте байєсівську статистику." Так що якщо ви використовуєте Байєсова статистику правильно, то відновити закон Байеса (ліва фракцію вище) , і якщо у вас немає, то ви ігноруєте дані , і просто використовувати ваш перед на .P(H)

P(H|X)=P(X|H)P(H)P(X)P(C)+P(H)[1P(C)],
C=H

Я припускаю, що це відштовхується від критики, що в принципі баєси можуть скоригуватися до того, щоб підтримати висновок, який вони хочуть, тоді як баєси стверджують, що насправді так не працює баєсова статистика.

(І так, ви успішно обстріляли мене. Хоч я ні математик, ні фізик, тому я не впевнений, скільки балів я вартую.)


60
Розумний жарт, вкладений у формулу вище, полягає в тому, що якщо ви неправильно не використовуєте байєсівську статистику, ваш висновок повністю не залежить від істини.
Кліф АВ

25
Я сподіваюся, що ви не набрали відповіді під час переходу через зайняту вулицю. Я не буду брати участі в цьому ...
eric_kernfeld

6
Вигляд байєсів, які були згадані вище, не є байесійськими статистиками, вони є юристами-
байесами

4
@CliffAB Я не знаю, чи назвав би це хитрим жартом чи законом природи.
eric_kernfeld

7
@CLiffAB Ви маєте на увазі "Ваша задня частина (як обчислюється за цією формулою) не залежить від доказів"?
Накопичення

31

Вважаєте чи ні, ця модель часто виникає у дуже серйозних статистичних моделях, особливо коли йдеться про синтез даних, тобто намагається поєднувати висновки з декількох датчиків, які намагаються зробити висновок про одну подію.

Якщо датчик несправно працює, він може сильно змістити висновки, зроблені при спробі об'єднати сигнали з декількох джерел. Ви можете зробити модель більш надійною у цьому питанні, включивши невелику ймовірність того, що датчик просто передає випадкові значення, незалежні від фактичної події, яка вас цікавить. Це призвело до того, що якщо 90 датчиків слабко вказують на - це правда, але 1 датчик сильно вказує на - це правда, ми все одно повинні зробити висновок, щоABAвірно (тобто, задня ймовірність того, що цей сенсор зафіксовано, стає дуже високою, коли ми розуміємо, що він суперечить усім іншим датчикам). Якщо розподіл відмови не залежить від параметра, про який ми хочемо зробити висновок, то якщо задня ймовірність того, що це збій, велика, заходи цього датчика дуже мало впливають на задній розподіл для параметра, що цікавить; насправді незалежність, якщо задня ймовірність відмови дорівнює 1.

Це загальна модель, яку слід враховувати, коли йдеться про висновок, тобто чи слід замінювати теорему Байєса на Модифіковану теорему Байєса, коли ми робимо Байєсову статистику? Ні. Причина полягає в тому, що "правильне використання байєсівської статистики" насправді не є просто двійковим (або, якщо воно є, воно завжди помилковим). Будь-який аналіз матиме ступеня неправильних припущень. Для того, щоб ваші висновки були повністю незалежними від даних (що має на увазі формула), вам потрібно зробити надзвичайно грубі помилки. Якщо "неправильне використання статистики Байєса" на будь-якому рівні означало, що ваш аналіз повністю незалежний від істини, використання статистики було б абсолютно марним. Усі моделі помиляються, але деякі корисні і все таке.


5
Я здогадуюсь, що нам пощастило виявити режим статичних відмов наших датчиків - це один або інший край. Шум розжарювання набагато важче. Це дійсно прикро, коли з'ясується, що датчик працює правильно, і отримане значення неправильне, оскільки провід працює як антена.
Джошуа

@ Джошуа, сподіваюся, колись я встигну належним чином навчитися фільтрування Кальмана для таких ситуацій (а може, хтось напише геніальну відповідь SE, яка все зрозуміє?).
mbrig

@ Джошуа: Я вважаю, ти думаєш про набагато більш конкретну модель, ніж я. Хоча добре характеризує розподіл відмов, можна покращити умовивід, але вони все ще можуть бути дуже корисними у випадку дуже розпливчастих розподілів відмов. Наприклад, припустимо, що ми хотіли зробити висновок про параметр а сенсор вимірювання - якщо він працює. Ми могли б включити невелику ймовірність того, що це, скажімо, при невдачі. Якщо датчик сильно не погоджується з усіма іншими датчиками, задня ймовірність того, що це збій, стає дуже високою. μiN(aiμ,1)t(df=10)i
Кліф АВ
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.