REML проти ML stepAIC


10

Я відчуваю себе переповненим після спроби зануритися в літературу про те, як запустити мішаний аналіз моделі після його використання з використанням AIC для вибору найкращої моделі чи моделі. Я не думаю, що мої дані є настільки складними, але я шукаю підтвердження того, що те, що я зробив, є правильним, а потім порадити, як діяти далі. Я не впевнений, чи повинен я використовувати lme або lmer, а потім з будь-яким із них, якщо мені слід використовувати REML або ML.

У мене є цінність відбору, і я хочу знати, які коваріати найкраще впливають на це значення і дозволяють передбачити прогнози. Ось деякі складені приклади даних та мій код для мого тесту, з яким я працюю:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

У мене є 19 моделей, які досліджують ці дані за допомогою різних комбінацій і до двосторонніх умов взаємодії, але завжди з ідентифікатором як випадковим ефектом і comp1 як моєю залежною змінною.

  • Q1. Який використовувати? lme чи lmer? це важливо?

В обох цих випадках у мене є можливість використовувати ML або REML - і я отримую кардинально різні відповіді - за допомогою ML та AIC я закінчую 6 моделями, які мають аналогічні значення AIC, а комбінації моделей просто не мають сенсу, тоді як REML в результаті 2 найбільш ймовірні моделі є найкращими. Однак під час роботи REML я більше не можу використовувати anova.

  • Q2. є основною причиною використання ML через REML через використання з ANOVA? Це мені незрозуміло.

Я досі не в змозі запустити stepAIC або не знаю іншого способу звузити ці 19 моделей.

  • Q3. чи є спосіб використовувати stepAIC в цей момент?

3
Для Q2 ML є необхідним, оскільки порівняння, що використовують REML, недійсні при зміні фіксованих ефектів. Можливе корисне пов'язане питання тут: stats.stackexchange.com/a/16015/3601
Аарон залишив переповнення стека

@Aaron Я раніше розглядав це питання, але все ще був розгублений. Використовувати REML "працює" лише тоді, коли змінюється випадковий ефект? Я, очевидно, недостатньо розумію ML проти REML. Дякую, що допомагає в одному з моїх запитань!
Керрі

Так, це правильно. При порівнянні моделей REML слід використовувати лише у тих випадках, коли моделі мають однакові фіксовані ефекти. Відповідь розширено нижче.
Аарон вийшов із переповнення стека

Відповіді:


16

Q1. Який використовувати? lme чи lmer? це важливо? Або добре. Вони дадуть вам такі ж пристосування. lmeдасть вам p-значення, а lmerне буде, але це більше, ніж я хочу потрапити сюди. Найвідоміша посилання - це один із дописів Дуга Бейтса до списку розсилки R-help тут .

(застереження: вони використовують дещо різні алгоритми, тому можливі деякі обчислювально важкі випадки, коли те чи інше може зробити краще, але на практиці це дуже рідко, і насправді, швидше за все, це вказує на якусь неправильну уточнення моделі. Дивіться зовсім інші результати від lmer () та lme () .)

Q2. є основною причиною використання ML через REML через використання з ANOVA? Це мені незрозуміло. ML необхідний, оскільки порівняння, що використовують REML, недійсні, коли фіксовані ефекти змінюються. Можливе корисне пов'язане запитання тут: https://stats.stackexchange.com/a/16015/3601 . Щоб відповісти на ваше запитання в коментарі вище, так, при порівнянні моделей REML слід використовувати лише у тих випадках, коли моделі мають однакові фіксовані ефекти (тобто коли змінюються лише випадкові ефекти). Ймовірність REML залежить від того, які фіксовані ефекти є в моделі, і тому вони не порівнянні, якщо фіксовані ефекти змінюються. Як правило, вважається, що REML дає кращі оцінки випадкових ефектів, тому звичайна порада - це підходити до вашої найкращої моделі, використовуючи REML для остаточного висновку та звітності.

Q3. чи є спосіб використовувати stepAIC в цей момент? Для порівняння між вашими 19 моделями, які мають сенс у вашій ситуації, просто порівняйте AIC для всіх. Немає підстав використовувати поетапну процедуру взагалі. Ступінчасті процедури, як правило, сьогодні вважаються старомодними, оскільки вони не гарантують, що найкраща модель знайдена, а комп'ютери дозволяють легко порівнювати безліч моделей.


1

У подальшому копанні я також знайшов ці ресурси, які створюють резервні копії посилань, які надав Аарон, і є хорошими показаннями для тих, хто починає, як я. Розділи, пов’язані на http://lme4.r-forge.r-project.org/ для прикладів, переглядають слайд-посилання http://lme4.r-forge.r-project.org/slides/ на тій же сторінці проекту . У багатьох коротких курсах навіть є приклад R-коду, який був чудовою підмогою.
Також ця коротка відповідь доктора Болкера http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.