Чому орієнтовні значення найкращого лінійного неупередженого прогноктора (BLUP) відрізняються від найкращого лінійного неупередженого оцінювача (BLUE)?


20

Я розумію, що різниця між ними пов’язана з тим, чи змінна групування в моделі оцінюється як фіксований або випадковий ефект, але мені незрозуміло, чому вони не однакові (якщо вони не однакові).

Мене конкретно цікавить, як це працює при використанні оцінки невеликих площ, якщо це актуально, але я підозрюю, що питання стосується будь-якого застосування фіксованих та випадкових ефектів.

Відповіді:


26

Значення, отримані від BLUP, не оцінюються так само, як BLUE оцінки фіксованих ефектів; за умовою BLUP називаються прогнозами . Коли ви підходите до моделі змішаних ефектів, спочатку оцінюються середня величина та відхилення (і, можливо, коваріація) випадкових ефектів. Випадковий ефект для даної навчальної одиниці (скажімо, студента) згодом обчислюється із розрахункової середньої величини та дисперсії та даних. У простій лінійній моделі оцінюється середнє значення (як і залишкова дисперсія), але спостережувані показники вважаються складеними як помилки, так і помилки, що є випадковою змінною. У моделі змішаних ефектів ефект для даної одиниці також є випадковою змінною (хоча в деякому сенсі вона вже реалізована).

Ви також можете ставитися до таких одиниць як до фіксованих ефектів, якщо хочете. У цьому випадку параметри для цієї одиниці оцінюються як зазвичай. Однак у такому випадку середня кількість (наприклад) сукупності, з якої були одержані одиниці, не оцінюється.

Більше того, припущення про випадкові ефекти полягає в тому, що вони були відібрані вибірково у деякої популяції, і саме ви потурбуєтеся про населення. Припущення, що лежить в основі фіксованих ефектів, полягає в тому, що ви вибрали ці цілі цілеспрямовано, тому що це єдині одиниці, які вам важливі.

Якщо ви обернетесь і підходите до моделі змішаних ефектів і прогнозуєте ті самі ефекти, вони, як правило, «скорочуються» щодо популяційного середнього відносно їхніх оцінок за фіксованим впливом. Ви можете вважати це аналогічним байєсівському аналізу, де оцінене середнє значення та дисперсія вказують на нормальний попередній час, а BLUP - це як середнє значення заднього, яке походить від оптимального поєднання даних із попереднім.

Кількість усадки змінюється залежно від кількох факторів. Важливим визначенням того, наскільки далеко будуть прогнози випадкових ефектів від оцінок фіксованих ефектів, є відношення дисперсії випадкових ефектів до дисперсії помилок. Ось швидка Rдемонстрація найпростішого випадку з 5 одиницями "рівня 2", які вміщують лише засоби (перехоплення). (Ви можете вважати це тестовими балами для учнів у межах занять.)

library(lme4)   # we'll need to use this package
set.seed(1673)  # this makes the example exactly reproducible
nj = 5;    ni = 5;    g = as.factor(rep(c(1:nj), each=ni))

##### model 1
pop.mean = 16;    sigma.g = 1;    sigma.e = 5
r.eff1   = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff1, each=ni) + error

re.mod1  = lmer(y~(1|g))
fe.mod1  = lm(y~0+g)
df1      = data.frame(fe1=coef(fe.mod1), re1=coef(re.mod1)$g)

##### model 2
pop.mean = 16;    sigma.g = 5;    sigma.e = 5
r.eff2   = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff2, each=ni) + error

re.mod2  = lmer(y~(1|g))
fe.mod2  = lm(y~0+g)
df2      = data.frame(fe2=coef(fe.mod2), re2=coef(re.mod2)$g)

##### model 3
pop.mean = 16;    sigma.g = 5;    sigma.e = 1
r.eff3   = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff3, each=ni) + error

re.mod3  = lmer(y~(1|g))
fe.mod3  = lm(y~0+g)
df3      = data.frame(fe3=coef(fe.mod3), re3=coef(re.mod3)$g)

Таким чином, відношення дисперсії випадкових ефектів до дисперсії помилок становить 1/5 для model 1, 5/5 для model 2і 5/1 для model 3. Зауважте, що я використовував рівень кодування для моделей із фіксованими ефектами. Тепер ми можемо вивчити, як оцінюються фіксовані ефекти та передбачувані випадкові ефекти порівнюються для цих трьох сценаріїв.

df1
#         fe1     re1
# g1 17.88528 15.9897
# g2 18.38737 15.9897
# g3 14.85108 15.9897
# g4 14.92801 15.9897
# g5 13.89675 15.9897

df2
#          fe2      re2
# g1 10.979130 11.32997
# g2 13.002723 13.14321
# g3 26.118189 24.89537
# g4 12.109896 12.34319
# g5  9.561495 10.05969

df3
#         fe3      re3
# g1 13.08629 13.19965
# g2 16.36932 16.31164
# g3 17.60149 17.47962
# g4 15.51098 15.49802
# g5 13.74309 13.82224

Ще один спосіб у відповідь на прогнози випадкових ефектів, які ближче до оцінок фіксованих ефектів, - це коли у вас є більше даних. Ми можемо порівняти model 1вище, з його низьким співвідношенням відхилення випадкових ефектів до дисперсії помилок, до версії ( model 1b) з таким же співвідношенням, але набагато більше даних (зауважте, що ni = 500замість ni = 5).

##### model 1b
nj = 5;    ni = 500;    g = as.factor(rep(c(1:nj), each=ni))
pop.mean = 16;    sigma.g = 1;    sigma.e = 5
r.eff1b  = rnorm(nj,    mean=0, sd=sigma.g)
error    = rnorm(nj*ni, mean=0, sd=sigma.e)
y        = pop.mean + rep(r.eff1b, each=ni) + error

re.mod1b = lmer(y~(1|g))
fe.mod1b = lm(y~0+g)
df1b     = data.frame(fe1b=coef(fe.mod1b), re1b=coef(re.mod1b)$g)

Ось такі ефекти:

df1
#         fe1     re1
# g1 17.88528 15.9897
# g2 18.38737 15.9897
# g3 14.85108 15.9897
# g4 14.92801 15.9897
# g5 13.89675 15.9897

df1b
#        fe1b     re1b
# g1 15.29064 15.29543
# g2 14.05557 14.08403
# g3 13.97053 14.00061
# g4 16.94697 16.92004
# g5 17.44085 17.40445

У дещо пов’язаній примітці, Дуг Бейтс (автор пакету R lme4) не любить термін "BLUP" і використовує натомість "умовний режим" (див. С. 22-23 його проекту lme4 book pdf ). Зокрема, він вказує в розділі 1.6, що "BLUP" може бути змістовно використаний лише для лінійних моделей зі змішаними ефектами.


3
+1. Але я не впевнений, що ціную термінологічну різницю між "прогнозуванням" та "оцінкою". Отже, параметр розподілу "оцінюється", але латентну змінну можна лише "передбачити"? Чи правильно я розумію, що, наприклад, факторні навантаження в факторному аналізі "оцінюються", але показники фактора "прогнозуються"? Крім того, я вважаю надзвичайно заплутаним те, що те, що називається "найкращим лінійним неупередженим прогноктором", насправді є упередженим оцінником (тому що він реалізує усадку і, отже, повинен бути упередженим), якби його трактували як "оцінювача" фіксованих ефектів. ..
амеба повідомляє відновити Моніку

@amoeba, що все-таки означає "найкраще"? Найкраще що? Це найкраща оцінка середнього показника даних чи найкраща комбінація інформації, що міститься в даних та попередня? Чи допомагає вам байєсівська аналогія?
gung - Відновіть Моніку

2
Принаймні зрозуміло, що означає "лінійний" :-) Однак, якщо серйозно, я знайшов @whuber цю дуже корисну відповідь на термінологічну різницю між "прогнозуванням" та "оцінкою". Я думаю, що це прояснило мені термінологію, але навіть посилило моє відчуття, що BLUP - це скоріше оцінювач, незважаючи на свою назву. [продовження]
амеба каже Відновити Моніку

2
@amoeba, так, це все розумно. Але я не хотів би використовувати те саме ім’я для обох, тому що ви робите щось інше (тобто рівняння відрізняються) і корисно, щоб імена були чіткими.
gung - Відновіть Моніку

1
@amoeba, я налаштував фразу в першому абзаці, щоб деефатизувати ці терміни, щоб не переймати "передбачення", а щоб зберегти відмінність. Подивіться, чи думаєте ви, що я забив голку, чи слід її уточнити далі.
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.