Мені потрібно підходити до узагальненого розподілу Гаусса до 7-тьмяної хмари точок, що містять досить значну кількість людей, що мають велику вагу. Чи знаєте ви якийсь гарний пакет R для цієї роботи?
Мені потрібно підходити до узагальненого розподілу Гаусса до 7-тьмяної хмари точок, що містять досить значну кількість людей, що мають велику вагу. Чи знаєте ви якийсь гарний пакет R для цієї роботи?
Відповіді:
Є також mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Хоча одна обережність: моделювання сумішей у просторі з високими розмірами може отримати досить процесорний процес і об'єм пам'яті, якщо ваша хмара точок велика. Близько чотирьох років тому я робив партію 11-мірних даних в 50-200K точок, і це було, як правило, набігати на 4-11 ГБ оперативної пам’яті і займати до тижня, щоб обчислити для кожного випадку (а в мене було 400). Це, звичайно, можливо, але може бути головним болем, якщо ви використовуєте спільний обчислювальний кластер або маєте обмежені ресурси.
Це звучить як класична багатоваріантна модель гауссової суміші. Я думаю, що пакет BayesM може працювати.
Ось декілька багатоваріантних пакетів Gaussian суміші