Як визначається


11

Скажіть, що - неперервна випадкова величина, а - дискретна. YX

Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)

Як ми знаємо, оскільки - неперервна випадкова величина. І виходячи з цього, я маю намір зробити висновок, що ймовірність не визначена.Pr(Y=y)=0YPr(X=x|Y=y)

Однак Вікіпедія стверджує, що насправді це визначено так:

Pr(X=x|Y=y)=Pr(X=x)fY|X=x(y)fY(y)

Питання: Будь-яка ідея, як Вікіпедії вдалося визначити цю ймовірність?


Моя спроба

Ось моя спроба, щоб досягти цього результату у Вікіпедії в межах обмежень:

Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)=limd0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=limd0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=Pr(X=x)fY|X=x(y)fY(y)

Тепер схоже, визначається як , що відповідає що стверджує Вікіпедія.Pr ( X = x ) f Y | X = x ( y )Pr(X=x|Y=y)Pr(X=x)fY|X=x(y)fY(y)

Так це зробила Вікіпедія?

Але я все ще відчуваю, що я тут зловживаю численням. Тому я вважаю, що не визначено, але в межах максимальної наближеності ми визначаємо і , але не прямо, тоді визначається \ Pr (X = x | Y = y) .Pr ( Y = y ) Pr ( Y = y | X = x ) Pr ( X = x | Y = y )Pr(X=x|Y=y)Pr(Y=y)Pr(Y=y|X=x)Pr(X=x|Y=y)

Але я багато в чому не впевнений у багатьох речах, у тому числі в тому, що я там робив, і я відчуваю, що, можливо, навіть не повністю розумію сенс того, що робив.


1
Дійсно, Pr (X = x) = 0, але щільність X у xf (x) може не дорівнювати 0. Чи не слід використовувати мітку "самонавчання" ??
Lil'Lobster

2
@Lil Наскільки я знаю, тег "самонавчання" є при вирішенні домашніх завдань. Я цього не роблю.
печерник

1
Сторінка Вікіпедії насправді посилається на виведення: en.wikipedia.org/wiki/Bayes'_theorem#Derivation
Іцен де Бур

3
Я боюся, що ваше походження не має математичного обгрунтування як для всіх коли безперервний. y Y YP(Y=y)=0yYY
Сіань

Відповіді:


10

Умовний розподіл ймовірностей , , формально визначається як рішення рівняння , де позначає - алгебра , пов'язана з розподілом . Одне з таких рішень надається формулою Байєса (1763), як зазначено у Вікіпедії :x X y Y P ( X = x , Y A ) = A P ( X = x | Y = y ) f Y ( y ) d yP(X=x|Y=y)xXyYσ ( Y ) σ Y P ( X = x | Y = y ) = P ( X = x ) f Y | X = x ( y )

P(X=x,YA)=AP(X=x|Y=y)fY(y)dyAσ(Y)
σ(Y)σY σ ( Y )
P(X=x|Y=y)=P(X=x)fY|X=x(y)fY(y)xX, yY
хоча версії, які довільно визначені на мірі нульового набору в , також є дійсними.σ(Y)

Поняття умовної ймовірності стосовно ізольованої гіпотези, ймовірність якої дорівнює 0, є неприпустимою. Бо ми можемо отримати розподіл вірогідності [широти] на меридіановому колі, лише якщо розглядати це коло як елемент розкладу всієї сферичної поверхні на меридіанні кола із заданими полюсами -  Андрій Колмогоров

Як показано парадоксом Бореля-Колмогорова , враховуючи певне значення потенційно прийняте , умовний розподіл ймовірностей не має точного значення, не тільки тому, що подія є мірою нульовою, але також тому, що ця подія може бути інтерпретована як вимірювана проти нескінченного діапазону -алгебр. Y P ( X = x | Y = y 0 ) { ω ;y0YP(X=x|Y=y0)σ{ω;Y(ω)=y0}σ

Примітка. Ось ще більш офіційне вступ, взяти з огляду теорії ймовірностей у блозі Террі Тао :

Визначення 9 (дезінтеграції) Нехай є випадковою величиною з відстані . Дезінтеграції від лежачої в основі вибіркового простору щодо являє собою підмножина з повної міри в (таким чином майже напевно) разом із призначенням міри ймовірності на підпросторі з для кожного , що вимірюється в тому сенсі, що картаYR(R,(μy)yR)ΩYRRμYYRP(|Y=y)Ωy:={ωΩ:Y(ω)=y}ΩyRyP(F|Y=y)вимірюється для кожної події , і така, що для всіх таких подій, де - (майже достовірно визначена) випадкова величина, визначена рівній коли .F

P(F)=EP(F|Y)
P(F|Y)P(F|Y=y)Y=y

Враховуючи таку дезінтеграцію, ми можемо подію для будь-якого , замінивши на підпростір (з індукованою -алгебра), але замінивши базову міру ймовірності з . Таким чином, ми можемо умовити (безумовні) події та випадкові змінні до цієї події для створення умовних подій та випадкових змінних на умовному просторі, що спричинить умовні ймовірностіY=yyRΩΩyσPP(|Y=y)FX(F|Y=y)(X|Y=y)P(F|Y=y)(що відповідає існуючим позначенням цього виразу) та умовні очікування (припускаючи абсолютну інтегральність у цьому умовному просторі). Тоді ми встановлюємо як (майже достовірно визначена) випадкова величина, визначена рівній коли .E(X|Y=y)E(X|Y)Y = yE(X|Y=y)Y=y


1
Вже поставив +1, але ... можливо, це нітрозування, але хіба не було б більш точним позначити теорему Байєса як формулу Байєса / Лапласа ..?
Тім

2
@Tim: дякую, але я не хочу звучати занадто шовіністично! І факт полягає в тому, що формула Баєса для дискретної (біноміальної) і безперервної (бета) фігурує в папері Байєса (1763). Звичайно, Лаплас встановив результат у набагато ширшій загальності. YXY
Сіань

4

Я дам ескіз того, як шматочки можуть поєднуватися разом, коли безперервний, а - дискретний.XYX

Змішана щільність суглоба:

fXY(x,y)

Гранична щільність та ймовірність:

fY(y)=xXfXY(x,y)

P(X=x)=fXY(x,y)dy

Умовна щільність та ймовірність:

fYX(yX=x)=fXY(x,y)P(X=x)

P(X=xY=y)=fXY(x,y)fY(y)

Правило Байєса:

fYX(yX=x)=P(X=xY=y)fY(y)P(X=x)

P(X=xY=y)=fYX(yX=x)P(X=x)fY(y)

Звичайно, сучасний, суворий спосіб боротьби з вірогідністю - через теорію мір. Для визначення прециклічного ознайомлення див. Відповідь Сіань.


2

Зауважте, що у статті Вікіпедії фактично використовується таке визначення: Тобто це трактує результат як щільність, а не ймовірність, як у вас це є. Тому я б сказав, що ви праві, що не визначено, коли є безперервним і дискретним, тому ми замість цього розглянемо лише щільності ймовірності над у цьому випадку. P(X=x|Y=y)XYX

fX(x|Y=y)=P(Y=y|X=x)fX(x)p(Y=y)
P(X=x|Y=y)XYX

Редагувати: Через плутанину щодо нотації (див. Коментарі) вище, насправді, це стосується протилежної ситуації до того, про що просили печер.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.