На першому рівні я думаю, що все, що ви ігноруєте, зменшення цінності населення; " нахили та перехоплення на кожну тему з моделі змішаних ефектів ближче до оцінок кількості населення, ніж оцінки мінімумів у межах суб'єкта ". 1]. Наступне посилання, ймовірно, також допоможе ( Які правильні описи слід шукати на моїх змішаних моделях? ), Див. Відповідь Майка Лоуренса).
Крім того, я вважаю, що вам не пощастило в прикладі іграшки, тому що у вас ідеально збалансований дизайн, який викликає у вас точно таку ж оцінку у випадку відсутності значень.
Спробуйте наступний код, який має той самий процес, у якого немає пропущеного значення:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Де зараз, оскільки ваш дизайн не ідеально збалансований, ви не маєте однакових оцінок коефіцієнта.
Насправді, якщо ви граєте разом зі своїм пропущеним шаблоном значення нерозумно (так, наприклад:), y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
так що ваш дизайн все ще ідеально збалансований, ви знову отримаєте однакові коефіцієнти.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Вас маргінально оманливий ідеальний дизайн вашого оригінального експерименту. Коли ви вставляли НС в неврівноважений спосіб, ви змінили схему того, скільки "сили" могли окремі суб'єкти запозичити один у одного.
Коротше кажучи, різниці, які ви бачите, зумовлені ефектами усадки, а точніше, тому, що ви спотворили свій оригінальний ідеально збалансований дизайн з не ідеально збалансованими відсутніми значеннями.
Посилання 1: Дуглас Бейтс lme4: Моделювання змішаних ефектів з R , сторінки 71-72
m3
це 0,0011713" замістьm2
.