Співвідношення ймовірностей та відношення PDF-файлів


12

Я використовую Байєса для вирішення проблеми кластеризації. Після деяких обчислень я закінчую необхідність отримати співвідношення двох ймовірностей:

P(A)/P(B)

мати можливість отримати . Ці ймовірності отримуються шляхом інтеграції двох різних двовимірних KDE, як пояснено у цій відповіді :P(H|D)

P ( B ) = х Керівництво , Y : G ( X , Y ) < г ( R B , сек б ) г ( х , у )

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

де f^(x,y) і g^(x,y) - KDE, і інтеграція виконується для всіх точок нижче порогів f^(ra,sa) та g^(rb,sb) . Обидва KDE використовують ядро Гаусса . Репрезентативне зображення KDE, подібне до тих, з якими я працюю, можна побачити тут: Інтеграція оцінювача щільності ядра в 2D .

Я обчислюю KDE за допомогою pythonфункції stats.gaussian_kde , тому припускаю наступну загальну форму для неї:

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

де nдовжина мого масиву точок і hчи використовується пропускна здатність.

Інтеграли, наведені вище, обчислюються за допомогою процесу Монте-Карло, який досить обчислювально дорогий. Я десь читав (забув, де, вибачте), що у подібних випадках можна замінити відношення ймовірностей відношенням PDF-файлів (KDE), оцінених у порогових точках, щоб отримати однаково достовірні результати. Мене це цікавить, оскільки обчислення коефіцієнта KDE на порядок швидше, ніж обчислення відношення інтегралів з MC.

Тож питання зводиться до обгрунтованості цього виразу:

P(A)P(B)=f^(ra,sa)g^(rb,sb)

За яких обставин, якщо такі є, чи можу я сказати, що це відношення вірно?

[фіксована помилка (EDIT)]


Додати :

Ось в основному те саме питання, але зроблене в більш математичній формі.


1
Зауважимо, що існування відповідних забезпечується середньозначною теоремою для інтегралів. ra,b,sa,b
Дейв

1
Я вважаю, що коефіцієнт Міллса може бути актуальним.
whuber

@whuber це співвідношення, мабуть, вимагає, щоб я знав, значення P(X)якого я намагаюся уникати обчислення. Чи можете ви трохи розширити відповідність цього параметра?
Габріель

Відповіді:


3

KDE - це суміш звичайних розподілів. Давайте розглянемо одну з них.

Визначення і показують, що їх значення є інваріантними під час перекладу та масштабування в площині, тому досить врахувати стандартний нормальний розподіл з PDF . НерівністьP(A)P(B)f

f(x,y)f(r,s)

еквівалентно

x2+y2r2+s2.

Введення полярних координат дозволяє переписати інтегралρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

Тепер розглянемо суміш. Оскільки це лінійно,

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

Дійсно, і пропорційні. Постійна пропорційності дорівнює .fP2πh2


Що таке співвідношення пропорційності між і є особливим,f Pf можна оцінити, розглядаючи простий контрприклад. Нехай має рівномірний розподіл на вимірюваному наборі одиниці площі, а має рівномірний розподіл на вимірюваному наборі що не відходить від і має площу . Тоді суміш з PDF має постійне значення на , на , а в іншому місці дорівнює нулю. Три випадки слід розглядати:A 1 f 2 A 2 A 1 μ > 1 f = f 1 /f1A1f2A2A1μ>1f=f1/2+f2/21/2A11/(2μ)A2

  1. f ( r , s ) = 1 /(r,s)A1 . Тут досягає свого максимуму, звідки . Співвідношення .f(r,s)=1/2P(r,s)=1f(r,s)/P(r,s)=1/2

  2. е ( г , їв ) 1 / 2 0 1 1 / 2 F ( г ,(r,s)A2 . Тут суворо менше але більше . Таким чином, область інтеграції є доповненням і отриманий інтеграл повинен дорівнювати . Співвідношення .f(r,s)1/20A11/2f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. В іншому випадку дорівнює нулю, а інтеграл дорівнює нулю.fP

Очевидно, що коефіцієнт (де він визначений) не є постійним і коливається між та . Хоча цей розподіл не є безперервним, його можна зробити, додавши до нього нормальний розподіл. Зробивши обидві власні значення малі, це дуже мало змінить розподіл і дасть якісні однакові результати - лише тепер значення співвідношення будуть включати всі числа в інтервалі .1 / μ 1 ( 0 , Σ ) Σ f / P [ 1 , 1 / μ ]11/μ1(0,Σ)Σf/P[1,1/μ]


Цей результат також не узагальнює інших вимірів. По суті той же розрахунок, який розпочав цю відповідь, показує, що - неповна Гамма-функція, і це явно не те саме, що . Те, що два виміри є особливими, можна помітити, зазначивши, що інтеграція в по суті стосується відстаней, і коли вони нормально розподілені, функція відстані має - це експоненціальне розподіл. Експоненціальна функція унікальна тим, що вона пропорційна власній похідній - тому інтеграл і інтеграл повинні бути пропорційними.f P χ 2 ( 2 ) f PPfPχ2(2)fP


Це неймовірно відповідь шум, дуже дякую. Мені знадобиться деякий час, щоб повністю обробити все, що ви написали тут, але я повністю довіряю вам розрахунки, це означає, що я позначив питання вирішеним. Ура.
Габріель
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.