Відстань земляного двигуна (ЕМД) між двома гауссами


26

Чи існує формула закритої форми (або якась пов'язана з нею) ЕМД між x1N(μ1,Σ1) та x2N(μ2,Σ2) ?


2
Відповідно до en.wikipedia.org/wiki/Earth_mover%27s_distance EMD - це те саме, що відстань Мальви чи Вассерстейна, тож ви можете спробувати це googlin.
kjetil b halvorsen

2
Цей документ може бути корисним: vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

Відповіді:


27

Відстань наземного двигуна може бути записана як , де мінімальний розмір приймається за всі спільні розподіли X і Y з маргінальними X \ сім P , Y \ Q сім . Це також відоме як перша відстань Вассерстейна , яка W_p = \ inf \ зліва (\ E \ lVert X - Y \ rVert ^ p \ справа) ^ {1 / p} з однаковим мінімумом.EMD(P,Q)=infEXYXYXPYQWp=inf(EXYp)1/p

Нехай XP=N(μx,Σx) , YQ=N(мку,Σу) .

Нижня межа: За нерівності Дженсена, оскільки норми опуклі,

ЕХ-YЕ(Х-Y)=мкх-мку,
тому ЕМД завжди принаймні відстань між засобами (для будь-яких розподілів).

Верхня межа на основі W2 : Знову нерівність Дженсена (ЕХ-Y)2ЕХ-Y2 . Таким чином W1W2 . Але Доусон і Ландау (1982) встановлюють, що

W2(П,Q)2=мкх-мку2+тr(Σх+Σу-2(ΣхΣу)1/2),
даючи верхню межу на ЕМD=W1 .

Більш щільна верхня межа: Розглянемо з'єднання Це карта, отримана Кноттом і Смітом (1984) , Про оптимальне відображення розподілів , Журнал теорії та застосувань оптимізації, 43 (1) стор 39-49 як оптимальне відображення для ; дивіться також цю публікацію в блозі . Зауважимо, що і

ХN(мкх,Σх)Y=мку+Σх-12(Σх12ΣуΣх12)12Σх-12А(Х-мкх).
W2A=ATEYW2А=АТ
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
щоб з'єднання було дійсним.

Відстань тоді , де зараз що є нормальним з XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ЕD=мкх-мкуВарD=(Я-А)Σх(Я-А)Т=Σх+АΣхА-АΣх-ΣхА=Σх+Σу-Σх-12(Σх12ΣуΣх12)12Σх12-Σх12(Σх12ΣуΣх12)12Σх-12.

Таким чином, верхня межа для дорівнює . На жаль, закриту форму для цього очікування напрочуд неприємно записати на загальні багатоваріантні нормали: див. Це питання , як і це .W1(П,Q)ЕD

Якщо дисперсія закінчується кулястою (наприклад, якщо , , то дисперсія стає ), колишня питання дає відповідь з точки зору узагальненого многочлена Лагерра.DΣх=σх2ЯΣу=σу2ЯD(σх-σу)2Я

Загалом, у нас є проста верхня межа для на основі нерівності Дженсена, отриманого, наприклад, у першому питанні: ЕD

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
Рівність у кінці тому, що матриці та схожі , тому вони мають однакові власні значення, і тому їх квадратні корені мають однаковий слід.ΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

Ця нерівність сувора до тих пір, поки не вироджується, що в більшості випадків, коли .DΣxΣy

Припущення : можливо, ця ближча верхня межа, , є тісною. Потім знову у мене довгий час була інша верхня межа, яку я гадав, що вона була тіснішою, що насправді було вільнішою, ніж , тому, можливо, вам не слід занадто довіряти цій здогадці. :)EDW2

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.