Міцний багатоваріантний гауссовий вміст у R


11

Мені потрібно підходити до узагальненого розподілу Гаусса до 7-тьмяної хмари точок, що містять досить значну кількість людей, що мають велику вагу. Чи знаєте ви якийсь гарний пакет R для цієї роботи?


3
Ви знайдете посилання щонайменше на чотири пакети R для виявлення багатоваріантних людей, що переживають люди, у відповідях на подібне запитання на сайті stats.stackexchange.com/questions/213/… . Це може бути гарним початком.
whuber

Можливо, це питання мені ухиляється, але, що стосується багатоваріантної гауссової дистрибуції, чому б просто не використати емпіричне середнє значення та СД як MLE? Потім можна зосередитись на діагностичній статистиці, якщо є високі точки впливу / важелів.
АдамО

Я думаю, що питання полягає у використанні чогось на зразок функції Huberized втрат для оцінки параметрів. Я не фахівець, але, можливо, використання втрати Хубера, щоб відповідати середньому, було б початком.
Том Діттеріх

Відповіді:


1

Є також mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

Хоча одна обережність: моделювання сумішей у просторі з високими розмірами може отримати досить процесорний процес і об'єм пам'яті, якщо ваша хмара точок велика. Близько чотирьох років тому я робив партію 11-мірних даних в 50-200K точок, і це було, як правило, набігати на 4-11 ГБ оперативної пам’яті і займати до тижня, щоб обчислити для кожного випадку (а в мене було 400). Це, звичайно, можливо, але може бути головним болем, якщо ви використовуєте спільний обчислювальний кластер або маєте обмежені ресурси.


1

Це звучить як класична багатоваріантна модель гауссової суміші. Я думаю, що пакет BayesM може працювати.

Ось декілька багатоваріантних пакетів Gaussian суміші

  • bayesm: cran.r-project.org/web/packages/bayesm/index.html
  • mixtools: www.jstatsoft.org/v32/i06/paper
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.