Коли використовувати модель суміші Гаусса?


9

Я новачок у використанні GMM. Мені не вдалося знайти відповідної допомоги в Інтернеті. Чи може хто-небудь, будь ласка, надати мені правильний ресурс на тему "Як вирішити, чи використання GMM відповідає моїй проблемі?" або у випадку проблем із класифікацією "Як вирішити, чи потрібно використовувати класифікацію SVM чи класифікацію GMM?"


що таке набір даних ур і яка ваша точна проблема? Він використовується, коли за даними слідує (це суміш) більше 1 нормального розподілу. Дивіться ще одне питання - stats.stackexchange.com/questions/236295/…
Arpit Sisodia

Ви можете розглядати це як форму кластеризації, де ви не маєте мічених даних і вважаєте, що приховані групування є ідеально багатоваріантними нормальними.
gung - Відновіть Моніку

@ arpit-sisodia, Ми працюємо над можливістю налаштування апаратної клавіатури, яка, здається, має специфічні особливості, і ми плануємо моделювати її за допомогою GMM. Ми не знаємо, що лежить в основі цього процесу, і тому ми намагаємось моделювати за допомогою методів машинного навчання. Отже, ми не впевнені, чи є насправді суміш гаусів у базовому процесі. Більше того, він багатовимірний, і ми не можемо візуалізувати його, щоб побачити, чи це суміш гауссів
Vinay

@ arpit-sisodia, надане вами посилання пропонує більше методу проб і помилок, щоб дізнатися, чи відповідає GMM моїм даним. Чи є переконливий спосіб / правило великого пальця, щоб вирішити, які моделі використовувати. Пробний та помилковий метод гри з більшою кількістю сумішей може відповідати моїм даним. Але чи є певний спосіб прийняти рішення? Як і нам потрібно мати лінійну відокремленість даних для класифікації SVM
Vinay

Відповіді:


4

На мою думку, ви можете виконувати GMM, коли знаєте, що точки даних є сумішами гауссового розподілу. В основному утворюють кластери з різним середнім і стандартним відхиленням. На веб-сайті scikit-learn є приємна схема. L

Класифікація GMM

Підхід полягає у пошуку кластерів, використовуючи методи м'якої кластеризації, а потім перевірити, чи є вони гауссовими. Якщо вони є, ви можете застосувати модель GMM, яка представляє весь набір даних.


1
часто ми не знаємо, чи дані є сумішшю гауссів. Отож, це більше подія з Гауссом та MoG і подивіться, чи підходить вона. Але немає правил щодо використання правил GMM
Vinay

2
Згідно з моїм досвідом, вам потрібно знайти шаблон у даних, що є його моделлю Суміш. Приємним
Slayer

0

ГММ, як правило, є гарним місцем для початку, якщо ваша мета - або (1) кластерні спостереження, (2) вказати генеративну модель, або (3) оцінити щільність. Насправді, для кластеризації, GMM - це надмножина k-засобів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.