Різні перетворення щільності ймовірності через якобіанський фактор


12

У розпізнаванні образів Бішопа та машинному навчанні я прочитав наступне, одразу після введення щільності ймовірності p(x(a,b))=abp(x)dx :

При нелінійній зміні змінної щільність ймовірності перетворюється по-різному від простої функції завдяки якобіанському фактору. Наприклад, якщо ми розглянемо зміну змінних x=g(y) , то функція f(x) стає f~(y)=f(g(y)) . Тепер розглянемо щільність ймовірності px(x) яка відповідає щільності py(y) стосовно нової змінної y , де суфекти позначають той факт, що px(x) і py(y) - різна щільність. Спостереження, що потрапляють у діапазон (x,x+δx) , для малих значень δx будуть перетворені в діапазон (y,y+δy ), де , отже, p_y (y) = p_x (x) | \ frac {dx} {dy} | = p_x (g (y)) | g \ prime (y) | .px(x)δxpy(y)δypy(y)=px(x)|dxdy|=px(g(y))|g(y)|

Що таке якобійський фактор і що саме все означає (можливо, якісно)? Єпископ каже, що наслідком цієї властивості є те, що концепція максимальної щільності ймовірності залежить від вибору змінної. Що це означає?

Як на мене, це виглядає зовсім непритомним (враховуючи це у вступній главі). Буду вдячний за деякі підказки, дякую!



1
Чудовий опис якобійського чинника дивіться у відеоуроці Ханської академії про детермінант Якобії. khanacademy.org/math/multivariable-calculus/…
JStrahl

Відповіді:


8

Я пропоную вам прочитати рішення питання 1.4, яке забезпечує добру інтуїцію.

У двох словах, якщо у вас є довільна функція та дві змінні і які пов'язані між собою функцією , то ви можете знайти максимум функції або шляхом прямого аналізу : або перетворена функція : . Не дивно, і будуть пов'язані з кожним як (тут я припустив, що .f(x)xyx=g(y)f(x)x^=argmaxx(f(x))f(g(y))y^=argmaxy(f(g(y))x^y^x^=g(y^)y:g(y)0)

Це не стосується розподілу ймовірностей. Якщо у вас є розподіл ймовірностей та дві випадкові величини, які пов'язані між собою через . Тоді немає прямого зв’язку між і . Це відбувається через якобіанський фактор - фактор, який показує, як об'єм відносно змінюється такою функцією, як .px(x)x=g(y)x^=argmaxx(px(x))y^=argmaxy(py(y))g(.)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.