Я провів експеримент, коли я виховував різні сім'ї, що походять з двох різних джерел. Кожній родині було призначено один з двох методів лікування. Після експерименту я виміряв кілька ознак на кожній особі. Щоб перевірити ефект від лікування або джерела, а також їх взаємодії, я використовував лінійну модель змішаного ефекту з сім'єю як випадковий фактор, тобто
lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")
поки що добре, Тепер я повинен обчислити відносні дисперсійні компоненти, тобто відсоток варіації, який пояснюється або лікуванням, або джерелом, а також взаємодією.
Без випадкового ефекту я міг легко використовувати суми квадратів (SS) для обчислення дисперсії, поясненої кожним фактором. Але для змішаної моделі (з оцінкою ML) немає СС, отже, я подумав, що я можу використовувати «Лікування» та «Джерело» як випадкові ефекти, щоб оцінити дисперсію, тобто
lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")
Однак у деяких випадках lme не збігається, тому я використовував lmer з пакету lme4:
lmer(Trait~1+(Treatment*Source|Family),data=DATA)
Де я витягую дисперсії з моделі, використовуючи підсумкову функцію:
model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]
Я отримую ті самі значення, що і для функції VarCorr. Потім я використовую ці значення для обчислення фактичного відсотка варіації, приймаючи суму як загальну варіацію.
Там, де я боюся, є інтерпретація результатів від початкової моделі lme (з лікуванням та джерелом як фіксованими ефектами) та випадковою моделлю для оцінки компонентів дисперсії (з лікуванням та джерелом як випадковим ефектом). Я вважаю, що в більшості випадків відсоток дисперсії, пояснений кожним фактором, не відповідає значущості фіксованого ефекту.
Наприклад, для ознаки HD, початковий lme говорить про тенденцію до взаємодії, а також про важливість для лікування. Використовуючи зворотну процедуру, я вважаю, що лікування має близьку до значної тенденції. Однак, оцінюючи компоненти дисперсії, я вважаю, що джерело має найбільшу дисперсію, що становить до 26,7% від загальної дисперсії.
Lme:
anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
numDF denDF F-value p-value
(Intercept) 1 426 0.044523 0.8330
as.factor(Treatment) 1 426 5.935189 0.0153
as.factor(Source) 1 11 0.042662 0.8401
as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533
І lmer:
summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family)
Data: regrexpdat
AIC BIC logLik deviance REMLdev
-103.5 -54.43 63.75 -132.5 -127.5
Random effects:
Groups Name Variance Std.Dev. Corr
Family (Intercept) 0.0113276 0.106431
as.factor(Treatment) 0.0063710 0.079819 0.405
as.factor(Source) 0.0235294 0.153393 -0.134 -0.157
as.factor(Treatment)L:as.factor(Source) 0.0076353 0.087380 -0.578 -0.589 -0.585
Residual 0.0394610 0.198648
Number of obs: 441, groups: Family, 13
Fixed effects:
Estimate Std. Error t value
(Intercept) -0.02740 0.03237 -0.846
Звідси моє запитання, чи правильно, що я роблю? Або я повинен використовувати інший спосіб оцінити кількість дисперсії, пояснену кожним фактором (тобто лікування, джерело та їх взаємодія). Наприклад, чи буде розмір ефекту більш підходящим шляхом?