Чи можна застосувати дивергенцію KL між дискретним та безперервним розподілом?


12

Я не математик. Я шукав в Інтернеті про KL Divergence. Що я дізнався - це розбіжність KL вимірює втрачену інформацію, коли ми наближаємо розподіл моделі відносно вхідного розподілу. Я бачив це між будь-якими двома безперервними або дискретними розподілами. Чи можемо ми зробити це між безперервним та дискретним чи навпаки?


Відповіді:


4

Ні: розбіжність KL визначається лише для розподілів на загальному просторі. Він запитує про щільність ймовірності точкиx за двома різними розподілами, p(x) і q(x). Якщоp - це розподіл на R3 і q розподіл на Z, тоді q(x) не має сенсу для балів pR3 і p(z) не має сенсу для балів zZ. Насправді, ми навіть не можемо це зробити для двох безперервних розподілів на просторах різних розмірів (або дискретних, або будь-якого випадку, коли основні простори ймовірностей не збігаються).

Якщо ви маєте на увазі конкретний випадок, можливо, можна придумати якийсь подібний настрій міри, що відрізняються між розподілами. Наприклад, може бути доцільним кодувати безперервний розподіл під кодом для дискретного (очевидно, із втраченою інформацією), наприклад, округленням до найближчої точки дискретного випадку.


Зауважимо, що розбіжність KL між дискретними та абсолютно неперервними розподілами добре визначена.
Олів'є

@Olivier Звичайне визначення вимагає загальної домінуючої міри, ні?
Дугал

1
Ви праві, коли P і Q визначені на різних просторах. Але у загальному вимірюваному просторі такий захід завжди існує (наприклад, Р + Q), і розбіжність KL не залежить від конкретного вибору домінуючої міри.
Олів'є

8

Так, відмінності KL між неперервними та дискретними випадковими змінними добре визначені. ЯкщоP і Q - це розподіли на якомусь просторі X, то обидва P і Q мають щільність f, g з повагою до μ=P+Q і

DKL(P,Q)=Xflogfgdμ.

Наприклад, якщо X=[0,1], P - міра Лебега і Q=δ0 - точкова маса при 0, тоді f(x)=11x=0, g(x)=1x=0 і

DKL(P,Q)=.

Як ти це доводиш Xflogfgdμне залежить від домінуючого заходу?
Габріель Ромон

Зміна теореми міри.
Олів'є

1

Не взагалі. Дивергенція KL є

DКL(П || Q)=Хжурнал(гПгQ)гП

за умови, що П є абсолютно безперервним щодо Q і обидва П і Q є σ-кінцевий (тобто за умов, де гПгQ чітко визначено).

Для "неперервної дискретності" KL-розбіжності між заходами на звичайному просторі, у вас є випадок, коли міра Лебега абсолютно безперервна щодо міри підрахунку, але міра підрахунку не є σ-кінцевий.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.