Я навіть не впевнений, що питання має багато сенсу, але я думаю, що я побачив пару назв робіт, де вони пропонували випадковий ліс із випадковими ефектами. Чи можливо це в R?
Я навіть не впевнений, що питання має багато сенсу, але я думаю, що я побачив пару назв робіт, де вони пропонували випадковий ліс із випадковими ефектами. Чи можливо це в R?
Відповіді:
Вони зазвичай не використовуються разом, і перед їх поєднанням слід бути обережними.
Випадкові ліси зазвичай використовуються як класифікатори. Причиною того, що ви б використовували випадковий ліс замість іншого методу (наприклад, кластеризація K-засобів), є те, що у вас може бути велика кількість вимірів, які ви хочете класифікувати. Проблема з великою кількістю вимірів полягає в тому, що якби ви хотіли перевірити всі комбінації порядків розмірів, у вас була б велика кількість варіантів (вона зростає швидше, ніж кількість факторів вимірів).
Випадкові ефекти зазвичай використовуються при регресії з повторними заходами одного і того ж. Вони зазвичай використовуються в моделях зі змішаними ефектами, де термін змішаний позначає як фіксовані, так і випадкові ефекти. Вважається, що фіксовані ефекти відображають параметри, які ви побачите знову (наприклад, наркотики або вік людини). Як вважається, випадкові ефекти представляють собою примірник змінності навколо параметра, який ви більше не побачите (наприклад, конкретна особа).
Є приклади їх спільного використання, коли є кластерні дані http://dx.doi.org/10.1080/00949655.2012.741599 та http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Я не знаю жодного пакету R, який може зробити цей аналіз.
Так, це можливо. Ви повинні перевірити " RE-EM Trees: підхід до вибору даних для поздовжніх та кластеризованих даних " та пов'язаний з ним пакет R REEMtree .
Минув час, як я подивився на папір. Я пригадую, автори ще не намагалися формувати ансамблі цих дерев, але нічого не припускало, що це не вийде.
Випадкові ліси зі змішаними ефектами - річ. Як зазначено у відповіді вище, існує велике дослідження про них групи доктора Ларокко в HEC Montreal. Документ знаходиться тут: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
По суті, це теоретично обгрунтований спосіб поєднання нелінійного моделювання випадкових лісів з лінійними випадковими ефектами.
Ми щойно випустили пакет з відкритим кодом у Python, що реалізує MERF, використовуючи вищевказаний алгоритм у статті.
Ми написали докладний пост у блозі про пакет та про те, як його використовувати для кластерних наборів даних.