Значення, отримані від BLUP, не оцінюються так само, як BLUE оцінки фіксованих ефектів; за умовою BLUP називаються прогнозами . Коли ви підходите до моделі змішаних ефектів, спочатку оцінюються середня величина та відхилення (і, можливо, коваріація) випадкових ефектів. Випадковий ефект для даної навчальної одиниці (скажімо, студента) згодом обчислюється із розрахункової середньої величини та дисперсії та даних. У простій лінійній моделі оцінюється середнє значення (як і залишкова дисперсія), але спостережувані показники вважаються складеними як помилки, так і помилки, що є випадковою змінною. У моделі змішаних ефектів ефект для даної одиниці також є випадковою змінною (хоча в деякому сенсі вона вже реалізована).
Ви також можете ставитися до таких одиниць як до фіксованих ефектів, якщо хочете. У цьому випадку параметри для цієї одиниці оцінюються як зазвичай. Однак у такому випадку середня кількість (наприклад) сукупності, з якої були одержані одиниці, не оцінюється.
Більше того, припущення про випадкові ефекти полягає в тому, що вони були відібрані вибірково у деякої популяції, і саме ви потурбуєтеся про населення. Припущення, що лежить в основі фіксованих ефектів, полягає в тому, що ви вибрали ці цілі цілеспрямовано, тому що це єдині одиниці, які вам важливі.
Якщо ви обернетесь і підходите до моделі змішаних ефектів і прогнозуєте ті самі ефекти, вони, як правило, «скорочуються» щодо популяційного середнього відносно їхніх оцінок за фіксованим впливом. Ви можете вважати це аналогічним байєсівському аналізу, де оцінене середнє значення та дисперсія вказують на нормальний попередній час, а BLUP - це як середнє значення заднього, яке походить від оптимального поєднання даних із попереднім.
Кількість усадки змінюється залежно від кількох факторів. Важливим визначенням того, наскільки далеко будуть прогнози випадкових ефектів від оцінок фіксованих ефектів, є відношення дисперсії випадкових ефектів до дисперсії помилок. Ось швидка R
демонстрація найпростішого випадку з 5 одиницями "рівня 2", які вміщують лише засоби (перехоплення). (Ви можете вважати це тестовими балами для учнів у межах занять.)
library(lme4) # we'll need to use this package
set.seed(1673) # this makes the example exactly reproducible
nj = 5; ni = 5; g = as.factor(rep(c(1:nj), each=ni))
##### model 1
pop.mean = 16; sigma.g = 1; sigma.e = 5
r.eff1 = rnorm(nj, mean=0, sd=sigma.g)
error = rnorm(nj*ni, mean=0, sd=sigma.e)
y = pop.mean + rep(r.eff1, each=ni) + error
re.mod1 = lmer(y~(1|g))
fe.mod1 = lm(y~0+g)
df1 = data.frame(fe1=coef(fe.mod1), re1=coef(re.mod1)$g)
##### model 2
pop.mean = 16; sigma.g = 5; sigma.e = 5
r.eff2 = rnorm(nj, mean=0, sd=sigma.g)
error = rnorm(nj*ni, mean=0, sd=sigma.e)
y = pop.mean + rep(r.eff2, each=ni) + error
re.mod2 = lmer(y~(1|g))
fe.mod2 = lm(y~0+g)
df2 = data.frame(fe2=coef(fe.mod2), re2=coef(re.mod2)$g)
##### model 3
pop.mean = 16; sigma.g = 5; sigma.e = 1
r.eff3 = rnorm(nj, mean=0, sd=sigma.g)
error = rnorm(nj*ni, mean=0, sd=sigma.e)
y = pop.mean + rep(r.eff3, each=ni) + error
re.mod3 = lmer(y~(1|g))
fe.mod3 = lm(y~0+g)
df3 = data.frame(fe3=coef(fe.mod3), re3=coef(re.mod3)$g)
Таким чином, відношення дисперсії випадкових ефектів до дисперсії помилок становить 1/5 для model 1
, 5/5 для model 2
і 5/1 для model 3
. Зауважте, що я використовував рівень кодування для моделей із фіксованими ефектами. Тепер ми можемо вивчити, як оцінюються фіксовані ефекти та передбачувані випадкові ефекти порівнюються для цих трьох сценаріїв.
df1
# fe1 re1
# g1 17.88528 15.9897
# g2 18.38737 15.9897
# g3 14.85108 15.9897
# g4 14.92801 15.9897
# g5 13.89675 15.9897
df2
# fe2 re2
# g1 10.979130 11.32997
# g2 13.002723 13.14321
# g3 26.118189 24.89537
# g4 12.109896 12.34319
# g5 9.561495 10.05969
df3
# fe3 re3
# g1 13.08629 13.19965
# g2 16.36932 16.31164
# g3 17.60149 17.47962
# g4 15.51098 15.49802
# g5 13.74309 13.82224
Ще один спосіб у відповідь на прогнози випадкових ефектів, які ближче до оцінок фіксованих ефектів, - це коли у вас є більше даних. Ми можемо порівняти model 1
вище, з його низьким співвідношенням відхилення випадкових ефектів до дисперсії помилок, до версії ( model 1b
) з таким же співвідношенням, але набагато більше даних (зауважте, що ni = 500
замість ni = 5
).
##### model 1b
nj = 5; ni = 500; g = as.factor(rep(c(1:nj), each=ni))
pop.mean = 16; sigma.g = 1; sigma.e = 5
r.eff1b = rnorm(nj, mean=0, sd=sigma.g)
error = rnorm(nj*ni, mean=0, sd=sigma.e)
y = pop.mean + rep(r.eff1b, each=ni) + error
re.mod1b = lmer(y~(1|g))
fe.mod1b = lm(y~0+g)
df1b = data.frame(fe1b=coef(fe.mod1b), re1b=coef(re.mod1b)$g)
Ось такі ефекти:
df1
# fe1 re1
# g1 17.88528 15.9897
# g2 18.38737 15.9897
# g3 14.85108 15.9897
# g4 14.92801 15.9897
# g5 13.89675 15.9897
df1b
# fe1b re1b
# g1 15.29064 15.29543
# g2 14.05557 14.08403
# g3 13.97053 14.00061
# g4 16.94697 16.92004
# g5 17.44085 17.40445
У дещо пов’язаній примітці, Дуг Бейтс (автор пакету R lme4) не любить термін "BLUP" і використовує натомість "умовний режим" (див. С. 22-23 його проекту lme4 book pdf ). Зокрема, він вказує в розділі 1.6, що "BLUP" може бути змістовно використаний лише для лінійних моделей зі змішаними ефектами.