Як оцінити компоненти дисперсії з lmer для моделей з випадковими ефектами та порівняти їх з результатами lme


14

Я провів експеримент, коли я виховував різні сім'ї, що походять з двох різних джерел. Кожній родині було призначено один з двох методів лікування. Після експерименту я виміряв кілька ознак на кожній особі. Щоб перевірити ефект від лікування або джерела, а також їх взаємодії, я використовував лінійну модель змішаного ефекту з сім'єю як випадковий фактор, тобто

lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")

поки що добре, Тепер я повинен обчислити відносні дисперсійні компоненти, тобто відсоток варіації, який пояснюється або лікуванням, або джерелом, а також взаємодією.

Без випадкового ефекту я міг легко використовувати суми квадратів (SS) для обчислення дисперсії, поясненої кожним фактором. Але для змішаної моделі (з оцінкою ML) немає СС, отже, я подумав, що я можу використовувати «Лікування» та «Джерело» як випадкові ефекти, щоб оцінити дисперсію, тобто

lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")

Однак у деяких випадках lme не збігається, тому я використовував lmer з пакету lme4:

lmer(Trait~1+(Treatment*Source|Family),data=DATA)

Де я витягую дисперсії з моделі, використовуючи підсумкову функцію:

model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]

Я отримую ті самі значення, що і для функції VarCorr. Потім я використовую ці значення для обчислення фактичного відсотка варіації, приймаючи суму як загальну варіацію.

Там, де я боюся, є інтерпретація результатів від початкової моделі lme (з лікуванням та джерелом як фіксованими ефектами) та випадковою моделлю для оцінки компонентів дисперсії (з лікуванням та джерелом як випадковим ефектом). Я вважаю, що в більшості випадків відсоток дисперсії, пояснений кожним фактором, не відповідає значущості фіксованого ефекту.

Наприклад, для ознаки HD, початковий lme говорить про тенденцію до взаємодії, а також про важливість для лікування. Використовуючи зворотну процедуру, я вважаю, що лікування має близьку до значної тенденції. Однак, оцінюючи компоненти дисперсії, я вважаю, що джерело має найбільшу дисперсію, що становить до 26,7% від загальної дисперсії.

Lme:

anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
                                      numDF denDF  F-value p-value
(Intercept)                                1   426 0.044523  0.8330
as.factor(Treatment)                       1   426 5.935189  0.0153
as.factor(Source)                          1    11 0.042662  0.8401
as.factor(Treatment):as.factor(Source)     1   426 3.754112  0.0533

І lmer:

summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML 
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family) 
   Data: regrexpdat 
    AIC    BIC logLik deviance REMLdev
 -103.5 -54.43  63.75   -132.5  -127.5
Random effects:
 Groups   Name                                      Variance  Std.Dev. Corr                 
 Family   (Intercept)                               0.0113276 0.106431                      
          as.factor(Treatment)                      0.0063710 0.079819  0.405               
          as.factor(Source)                         0.0235294 0.153393 -0.134 -0.157        
          as.factor(Treatment)L:as.factor(Source)   0.0076353 0.087380 -0.578 -0.589 -0.585 
 Residual                                           0.0394610 0.198648                      
Number of obs: 441, groups: Family, 13

Fixed effects:
            Estimate Std. Error t value
(Intercept) -0.02740    0.03237  -0.846

Звідси моє запитання, чи правильно, що я роблю? Або я повинен використовувати інший спосіб оцінити кількість дисперсії, пояснену кожним фактором (тобто лікування, джерело та їх взаємодія). Наприклад, чи буде розмір ефекту більш підходящим шляхом?


Коефіцієнт лікування має 40x більше ступенів свободи, ніж вихідний фактор (псевдорепликація?). Це, безсумнівно, зменшує значення P для лікування.

Відповіді:


1

Один загальний спосіб визначення відносного внеску кожного фактора в модель - це вилучення коефіцієнта та порівняння відносної ймовірності з чимось на зразок тесту у квадраті чи:

pchisq(logLik(model1) - logLik(model2), 1)

Оскільки спосіб обчислення ймовірностей між функціями може дещо відрізнятися, я, як правило, порівнюю їх лише тим самим методом.


1
чи не повинно бути 1-pchisq(logLik(model1) - logLik(model2), 1)?
user81411
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.