Як ви порівнюєте два Гауссові процеси?


14

Дивергенція Куллбека-Лейблера є метрикою для порівняння двох функцій щільності ймовірності, але яка метрика використовується для порівняння двох XX і Y GP Y?


d ( X , Y ) = E [ sup t | X ( t ) - Y ( t ) | ]d(X,Y)=E[supt|X(t)Y(t)|]

@Zen: Якщо у вас є час, мені цікаво дізнатися більше про цю метрику відстані.
Ніл Г

Привіт, Ніл. Я мало про це знаю. Будь ласка, дивіться мою відповідь нижче.
Дзен

Відповіді:


8

Зауважте, що розподіл гауссових процесів є розширенням багатофакторного Гаусса для можливо нескінченного . Таким чином, ви можете використовувати дивергенцію KL між розподілами ймовірностей GP, інтегруючи над :XR XRX XR XRX

D K L ( P | Q ) = R X log d Pd Q dP.

DKL(P|Q)=RXlogdPdQdP.

Ви можете використовувати методи MC, щоб наблизити цю кількість чисельно до дискретного шляхом багаторазових процесів вибірки відповідно до їх розподілу GP. Я не знаю, чи достатньо хороша швидкість конвергенції ...ХX

Зауважте, що якщо є кінцевим з , тоді ви переходите до звичайної дивергенції KL для багатоваріантних нормальних розподілів: X X| X | = n |X|=nD K L ( G P ( μ 1 , K 1 ) , G P ( μ 2 , K 2 ) ) = 12 (tr(K - 1 2 K1)+(μ2-μ 1 ) K - 1 2 ( μ 2-μ1)n+log|K2||K1|)

DKL(GP(μ1,K1),GP(μ2,K2))=12(tr(K12K1)+(μ2μ1)K12(μ2μ1)n+log|K2||K1|)

Як я можу обчислити два згадані вами засоби (mu1 та mu2). Або я повинен вважати їх рівним нулю, як зазвичай для гауссового процесу?
Марат Закіров

4

Пам'ятайте, що якщо - процес Гаусса із середньою функцією та коваріаційною функцією , то для кожного випадковий вектор має багатоваріантний нормальний розподіл із середнім вектором та матрицею коваріації , де ми використали загальну абревіатуру .X:T×ΩRX:T×ΩRmmKKt1,,tkTt1,,tkT(X(t1),,X(tk))(X(t1),,X(tk))(m(t1),,m(tk))(m(t1),,m(tk))Σ=(σij)=(K(ti,tj))Σ=(σij)=(K(ti,tj))X(t)=X(t,)X(t)=X(t,)

Кожна реалізація є речовій функцією, область є безліч індексів . Припустимо, що . Враховуючи два Гауссових процеси і , одна спільна відстань між двома реалізаціями і є. Отже, здається природним визначити відстань між двома процесами і як X(,ω)X(,ω)TTT=[0,1]T=[0,1]XXYYX(,ω)X(,ω)Y(,ω)supt[0,1]|X(t,ω)Y(t,ω)|XYd(X,Y)=E[supt[0,1]|X(t)Y(t)|].()

Я не знаю, чи є аналітичний вираз для цієї відстані, але я вважаю, що ви можете обчислити наближення Монте-Карло наступним чином. Виправити деяку тонку сітку і намалювати зразки і з нормальні випадкові вектори (Х (t_1), \ точками, Х (t_k)) і (Y (Т_1), \ точки, Y (t_k)) , відповідно, для I = 1, \ точки, N . Орієнтовна d (X, Y) по \ frac {1} {N} \ sum_ {i = 1} ^ N \ max_ {1 \ leq j \ leq k} | x_ {ij} -y_ {ij} | \,. 0t1<<tk1(xi1,,xik)(yi1,,yik)(X(t1),,X(tk))(Y(t1),,Y(tk))i=1,,Nd(X,Y)1NNi=1max1jk|xijyij|.

Як ви відбираєте вибірку з кожного вектора? Якщо ви відбираєте вибірки лише в кожному з лікарів, ви не враховуєте відхилення. Інакше вам доведеться розробити послідовну методику відбору проб.
пушкар

Це чудовий ресурс: gaussianprocess.org/gpml/chapters
Дзен

Ви також можете прочитати всі відповіді на це питання: stats.stackexchange.com/questions/30652 / ...
ZEN

Зверніть увагу, що це не відстань, оскільки . Оскільки КЛ порівнює два розподіли, а не дві реалізації, відстань Дзен між двома ГП слід визначати як , і маємо, що для НЕ виродився гауссовский процес . d(X,X)0d(G1,G2)=EXG1,YG2[supt|X(t)Y(t)|]EXG,YGsupt|X(t)Y(t)|>0G
Еміль

@Emile: як це використовуючи визначення ? d(X,X)0()
Дзен
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.