Чому б ви передбачили модель змішаного ефекту, не враховуючи випадкових ефектів для прогнозування?


10

Це скоріше концептуальне запитання, але в міру використання Rя буду посилатися на пакунки в R. Якщо мета полягає у встановленні лінійної моделі для прогнозування, а потім робити прогнози, коли випадкові ефекти можуть бути недоступні, чи є користь від використання моделі змішаних ефектів, чи слід використовувати замість неї модель з фіксованим ефектом?

Наприклад, якщо у мене є дані про вагу порівняно з ростом з якоюсь іншою інформацією, і будую наступну модель, використовуючи lme4, коли предмет є фактором знрівні ( ):н=но.самpлес

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

Тоді я хочу мати можливість передбачити вагу моделі, використовуючи нові дані про зріст та вік. Очевидно, що відмінність суб'єктів у вихідних даних відображається в моделі, але чи можна використовувати цю інформацію для прогнозування? Скажімо, у мене є нові дані про зріст і вік, і хочу передбачити вагу, я можу зробити так:

predict(mod1,newdata=newdf) # newdf columns for height, age, subject

Це використовуватиме predict.merMod, і я можу або включити стовпчик для (нових) предметів у newdf, або встановити re.form =~0. По-перше, незрозуміло, що робить модель з «новими» предметними факторами, а в другому випадку, чи буде відхилена (усереднена в порівнянні з) для прогнозування відхилення від суб'єкта, відзняте в моделі?

В будь-якому випадку мені здається, що лінійна модель з фіксованим ефектом може бути більш доречною. Дійсно, якщо моє розуміння правильне, то модель з фіксованим ефектом повинна передбачати ті самі значення, що і змішана модель, якщо випадковий ефект не використовується в прогнозуванні. Чи має бути так? У Rній немає, наприклад:

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject

дає різні результати для:

mod2 <- lm(weight ~ height + age, data=df)

predict(mod2,newdata=newdf) # newdf columns for height, age



1
Можливо, вам хочеться передбачити нову групу, яка не була включена в оцінку
kjetil b halvorsen

Так, але в цьому випадку навіщо турбуватися із моделлю зі змішаним ефектом? Що дає вам, що модель з фіксованим ефектом відсутня, якщо ви ігноруєте випадкові ефекти в передбаченні?
tribalsoul

1
Ну, це може дати кращі оцінки, тому що у вас є краща (більш правильна) модель структури помилок
kjetil b halvorsen

Відповіді:


5

Простий мислительний експеримент: Ви виміряли вагу і зріст 5 немовлят після народження. І ти знову відміряв це від тих же немовлят через два роки. Тим часом ви майже кожен тиждень вимірювали вагу і зріст своєї доньки дитини, в результаті чого для неї було 100 пар. Якщо ви використовуєте модель зі змішаними ефектами, проблем немає. Якщо ви використовуєте модель з фіксованими ефектами, ви додаєте надмірну вагу вимірюванням своєї доньки до точки, коли ви отримаєте майже ту саму модель, якби використовували лише дані з неї. Отже, важливим є не лише висновок про правильне моделювання повторних заходів або структур невизначеності, а й для прогнозування. Взагалі, ви не отримуєте однакових прогнозів від моделі змішаних ефектів і від моделі фіксованих ефектів (з порушеннями припущень).

і я можу включати стовпчик для (нових) предметів у newdf

Ви не можете передбачити предметів, які не входили до вихідних даних (навчальних). Знову міркувальний експеримент: новий предмет ожиріння. Як модель могла знати, що вона знаходиться у верхньому кінці розподілу випадкових ефектів?

чи буде ігнорована відхилення від суб'єкта в моделі, просто проігнорована (усереднена) для прогнозування

Якщо я вас правильно зрозумів, то так. Модель дає оцінку очікуваної вартості для населення (зауважте, що ця оцінка все ще є умовною для початкових предметів).


1
Дякую за чітке пояснення та приклад, це все має сенс. Однак де ви заявляєте You can't predict for subjects which were not part of the original (training) data; Чи не встановлення re.form=~0та прогнозування від населення очікуваного значення, що дозволяє мені робити саме це? Зрозуміло, модель не використовує будь-якої предметної інформації в передбаченні, але справедливо сказати, що оцінка моделі змішаного ефекту все одно буде більш точною, ніж оцінка з еквівалентної моделі з фіксованим ефектом, де зміна конкретного предмета була проігноровано?
tribalsoul

1
Фіксована модель не застосовується, оскільки її припущення порушені. Ви повинні використовувати модель, яка включає структуру залежності. re.form=~0дає прогноз на рівні населення, що найкраще можна зробити для нових предметів.
Роланд

У мене виникло те саме питання, коли я використовував glmmLasso пакет у Р. Автор пакета, Андреас Гролл, заявив, що процедура glmmLasso використовує лише фіксовані ефекти для прогнозування нових предметів та фіксованих + випадкових ефектів для існуючих предметів у наступний період часу.
RobertF
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.