Інтуїція теореми Байєса


22

Я намагався розвинути на основі інтуїції розуміння теореми Байєса з точки зору попередньої , задньої , вірогідності та граничної ймовірності. Для цього я використовую таке рівняння: де являє собою гіпотезу чи переконання, а являє собою дані чи докази. Я зрозумів поняття заднього - це об'єднавча сутність, яка поєднує попередню віру та ймовірність події. Що я не розумію, що означає ймовірність ? І чому маргінальний АБ

P(B|A)=P(A|B)P(B)P(A)
AB
ймовірність у знаменнику?
Переглянувши пару ресурсів, я натрапив на цю цитату:

Імовірність є вага події визначається виникненням ... є задній ймовірністю події , за умови , що подія сталася.A P ( B | A )BAP(B|A)АBA

Вищеописані 2 твердження мені здаються ідентичними, просто написаними по-різному. Чи може хто-небудь пояснити, будь ласка, різницю між ними?


4
Ви маєте помилку (або помилкове уявлення). має бути "гіпотезою чи переконанням", а - "даними чи доказами" у вашій формулюванні. АBA
gung - Відновити Моніку

1
дивіться мою відповідь на math.stackexchange.com/a/1943255/1505 , саме так я зрозумів її інтуїтивно
Ліндон Уайт

Відповіді:


27

Хоча в законі Байєса є чотири компоненти, я вважаю за краще три понятійні компоненти:

P(B|A)2=P(A|B)P(A)3P(B)1
  1. До є те , що ви думали про , перш зустрівши нову і відповідну частину інформації (тобто, ). АB A
  2. Задній є те , що ви вірите (або повинен, якщо ви раціональні) про після зустрівши нову і відповідну частину інформації. B
  3. Фактор ймовірності , розділений на граничній імовірності нової інформації індексів інформативності нової інформації для ваших уявлень про . B

19

Вже є кілька хороших відповідей, але, можливо, це може додати щось нове ...

Я завжди думаю про правило Байєса з точки зору ймовірностей компонентів, які можна зрозуміти геометрично в умовах подій і як зображено нижче.БAB

Набори подій

Гранична ймовірність і задаються площ відповідних кіл. Усі можливі результати представлені , що відповідає набору подій " або ". У спільних ймовірностей відповідає події « і ».P ( B ) P ( A B ) = 1 A B P ( A B ) A BP(A)P(B)P(AB)=1AB P(AB)AB

У цьому рамках умовні ймовірності в теоремі Байєса можна розуміти як співвідношення площ. Імовірність задана - частка зайнята , виражена Аналогічно, ймовірність задано - частка зайнята , тобто B B A B P ( A | B ) = P ( A B )ABBAB БАААВ

P(A|B)=P(AB)P(B)
BAAAB
P(B|A)=P(AB)P(A)

Теорема Байєса насправді є лише математичним наслідком наведених вище визначень, які можна перезапустити як I знайти цю симетричну форму теореми Байєса набагато простіше запам'ятати. Тобто ідентичність має місце незалежно від того, який або позначений як "попередній" проти "задній".p ( A ) p ( B )

P(B|A)P(A)=P(AB)=P(A|B)P(B)
p(A)p(B)

(Ще один спосіб розуміння вищезгаданої дискусії наведений у моїй відповіді на це питання з точки зору більш «бухгалтерської таблиці».)


9

@gung має чудову відповідь. Я додав би один приклад, щоб пояснити "посвячення" на прикладі реального світу.

Для кращого зв’язку з прикладами реального світу, я хотів би змінити позначення, де використовують для представлення гіпотези ( у вашому рівнянні), а використовувати для представлення доказів. ( у вашому рівнянні.)HAEB

Отже, формула така

P(H|E)=P(E|H)P(H)P(E)

Зауважте, та сама формула може бути записана як

P(H|E)P(E|H)P(H)

де означає пропорційне, а - ймовірність, а - пріоритет . Це рівняння означає, що задня частина буде більшою, якщо права частина рівняння більша. І ви можете подумати про - константа нормалізації, щоб перетворити число на вірогідність (причина, по якій я кажу, що це константа, це тому, що докази вже наводяться.).P(E|H)P(H)P(E)E

Для прикладу реального світу, припустимо, ми виявляємо шахрайство щодо трансакцій кредитними картками. Тоді гіпотеза буде де представлення транзакції є нормальним або шахрайським. (Я вибрав крайній неврівноважений випадок, щоб показати інтуїцію).H{0,1}

З доменних знань, ми знаємо, що більшість транзакцій було б нормальним, лише дуже мало шахрайств. Припустимо, експерт сказав, що на було б шахрайством. Таким чином , ми можемо сказати , що до є і .11000P(H=1)=0.001P(H=0)=0.999

Кінцевою метою є обчислення що означає, що ми хочемо знати, чи є транзакція шахрайством, яке не ґрунтується на доказах на додаток до попередніх . Якщо ви подивитеся на праву частину рівняння, ми розкладемо його на вірогідність та на попереднє .P(H|E)

Там, де ми вже пояснювали те, що є попереднім , тут ми пояснюємо, що таке ймовірність. Припустимо, у нас є два типи доказів, які представляють, якщо ми бачимо нормальне або дивне географічне розташування транзакції.E{0,1}

Ймовірність може бути невеликою, що означає, що дана нормальна транзакція, дуже малоймовірно, що місце дивно. З іншого боку, може бути великим.P(E=1|H=0)P(E=1|H=1)

Припустимо, ми спостерігали, що ми хочемо побачити, чи це шахрайство чи ні, нам потрібно враховувати і попереднє, і ймовірне . Інтуїтивно, з попереднього рівня, ми знаємо, що шахрайських операцій дуже мало, ми, ймовірно, будемо дуже консервативно скласти класифікацію шахрайства, якщо тільки докази не є дуже сильними. Тому продукт між двома розглядатиме два фактори одночасно.E=1


Я думаю, що може бути помилка друку в попередньому : має бути а , правда? P(H=0)0.999P(H=1)=0.001
gc5

1

Зауважте, що правило Байєса є

P(a|b)=P(b,a)P(b)=P(b,a)P(b)P(a)P(a) .

Зверніть увагу на співвідношення

P(b,a)P(b)P(a).

Якщо , то . Тож це майже як сказати нам, наскільки суглоб відхиляється від повної незалежності, або скільки інформації мають змінні спільного.BAP(b,a)=P(b)P(a)

Цікаво, що журнал цього співвідношення також присутній у взаємній інформації:

I(A|B)=a,bP(a,b)logP(b,a)P(b)P(a)


0

Я часто зустрічаю перегляд теореми як таблиці, з можливими результатами для "B" як рядків та можливими результатами для "A" як стовпців. Спільні ймовірності - значення для кожної комірки. У цій таблиці ми маємоP(A,B)

ймовірність = пропорції рядків posterior = пропорції стовпців

Попередній і граничний аналогічно визначаються, але на основі "підсумків" замість конкретного стовпця

гранична = загальна кількість рядків попередня = загальна пропорція стовпця

Я знаходжу це допомагає мені.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.