Посилання, що виправдовують використання гауссових сумішей


14

Моделі гауссових сумішей (ГММ) привабливі, оскільки з ними просто працювати як аналітично, так і на практиці, і здатні моделювати деякі екзотичні розподіли без надмірної складності. Є декілька аналітичних властивостей, яких слід очікувати, які загалом не зрозумілі. Зокрема:

  • Скажімо, Sn - клас усіх гауссових сумішей з n компонентами. Чи гарантуємо нам, що при будь-якому безперервному розподілі на реалі, коли росте, ми можемо наближати до ГММ з незначними втратами в сенсі відносної ентропії? Тобто, чиPР Нт п інф PS п Д ( Р | | Р ) = 0 ?nP
    limninfP^SnD(P||P^)=0?
  • Скажімо, у нас є безперервний розподіл P і ми знайшли N -компонентну гауссова суміш P^ яка близька до P за сумарною варіацією: δ(P,P^)<ε . Чи можемо ми зв'язати D(P||P^) в термінах ϵ ?
  • Якщо ми хочемо спостерігати XPX через незалежний аддитивний шум YPY (як реальний, безперервний), і у нас є GMMs X^QX,Y^QN де δ(P,Q)<ϵ , тоді це значення невелике:
    |mmse(X|X+Y)mmse(X^|X^+Y^)|,
    тобто чи правда, що оцінювати X через Y шум приблизно так само важко, як оцінювати X^ через Y^ шум?
  • Чи можете ви це зробити для таких моделей, що не додають шуму, наприклад шуму Пуассона?

Мій (короткий) огляд літератури до цих пір виявив дуже прикладні навчальні посібники. Хтось має посилання, які суворо демонструють, за яких умов ми виправдані у використанні моделей сумішей?


3
Набір ГММ щільний у наборі розподілів у слабкій топології (відповідає конвергенції в розподілі); див., наприклад, тут . Я не впевнений , чи має ваша перша заява, хоча це, безумовно , потребують дозволяючи компоненти нульової дисперсії в суміші , щоб мати справу з будь-якими точковими масами в . Я також скептично ставлюсь до другої точки кулі, знову ж таки через проблему масових точок. P
Дугал

1
Хороше запитання, я вказав все повинно бути безперервним
enthdegree

1
Можливо, вам пощастить переглянути літературу про оцінку щільності ядра з ядрами Гаусса. Оскільки у вас є суміш гауссів з одним на зразок, то як кількість зразків збільшується, чи отримуєте ви асимптотично неупереджений і послідовний оцінювач розподілу? Я думаю, що відповідь "так", але не вдалося відразу знайти посилання.
Грег Вер Стіг

2
@ 5thdegree: Дуже добре запитання. Оскільки ви хочете використовувати сильні топології (розбіжність KL та сумарне коливання), загальна відповідь на ваші перші два пункти - ні: наприклад, розгляньте розподіл жиру; КЛ будь-якої кінцевої гауссової суміші нескінченна (я впевнений, що це працює, хоча і не на 100%). Але це призводить до набагато цікавішого питання, для якого підкласу розподілу ймовірностей застосовуються всі ваші кульові бали? Я не знаю відповіді, але це здається надзвичайно цікавим. Моя здогадка - це, ймовірно, майже всі розподіли ймовірностей.
Гійом Дехаєн

1
Я взяв клас з цією книжкою. Посилання Це робить деякі пристойні передумови щодо основ.
EngrStudent

Відповіді:


0

У економетриці, де контекст полягає у розподілі змішаних коефіцієнтів у моделях logit, стандартним посиланням є: Змішані моделі MNL для дискретного відгуку DANIEL MCFADDEN AND KENNETH TRENIN, ПІДПРИЄМСТВО ПРИКЛАДНОЇ ЕКОНОМЕТРИКИ, J. Appl. Екон. 15: 447-470 (2000).


0

Що стосується ваших питань:

  1. На дуже схожу байєсівську проблему суміші гаусианців Процесу Діріхле, я розумію, що відповідь - так. Ghosal (2013) .
  2. Коли я відвідував деякі бесіди на цю тему, здавалося, що в основному досягнуто прогресу, використовуючи дивергенцію КЛ. Подивіться слайди Гаррі ван Зантена .
  3. Мені не ясно. Однак це виглядає як проблема відокремлення джерела ( ). Це, як правило, набагато складніше, ніж моделювання суміші. Зокрема, для простого випадку ви б не змогли ідентифікувати справжні і через симетрію розподілів про нуль.P N = P S = N ( 0 , 1 ) X YPN,PSPN=PS=N(0,1)XY
  4. Дивіться четвертий з слайдів, зв'язаних вище, є список байєсівських моделей, щодо яких є гарантії конвергенції.

0

Ось часткова відповідь.

Скажімо, - клас усіх гауссових сумішей з компонентами. Чи гарантуємо нам, що при будь-якому безперервному розподілі на реалі, коли росте, ми можемо наближати до ГММ з незначними втратами в сенсі відносної ентропії? Тобто, чи п Р п Р Пт п інф PS п Д ( Р | | Р ) = 0 ?SннПнП

limнінфП^SнD(П||П^)=0?

Q Р Р п інф РS п D ( Р | | Р ) = D(ПQ)QППн

інфП^SнD(П||П^)=

Додаткові умови на потрібно сказати.П

Скажімо, у нас є безперервний розподіл і ми знайшли -компонентну гауссова суміш яка близька до за сумарною варіацією: . Чи можемо ми зв'язати в термінах ?Н Р Р δ ( Р , Р ) < ε D ( Р | | Р ) εПNП^Пδ(П,П^)<εD(П||П^)ϵ

Ні. Цей же приклад застосовується вище.

Якщо ми хочемо спостерігати через незалежний аддитивний шум (як реальний, безперервний), і у нас є GMMs де , тоді це значення невелике: тобто чи правда, що оцінювати через шум приблизно так само важко, як оцінювати через шум?ХПХYПYХ^QХ,Y^QYδ(П,Q)<ϵ

|ммсе(Х|Х+Y)-ммсе(Х^|Х^+Y^)|,
ХYХ^Y^

Х,Y,Х^,Y^Е[Х|Y]Е[Х^|Y^]|ЕП[(ЕП[Х|Y]-Х)2]-ЕQ[(ЕQ[Х|Y]-Х)2]|ТV(П,Q)

Я не зміг довести це ні в цілому, ні використовуючи додаткову структуру добавок, яку ми припустили на P, Q, або придумав будь-які зустрічні приклади.

Чи можете ви це зробити для таких моделей, що не додають шуму, наприклад шуму Пуассона?

Це неоднозначно. У контексті попереднього питання, якщо твердження у цій відповіді можна довести загалом, то відповідь - так.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.