Еквівалентність (0 + фактор | група) та (1 | група) + (1 | група: фактор) специфікацій випадкових ефектів у разі симетрії сполуки


13

Дуглас Бейтс зазначає, що наступні моделі є еквівалентом "якщо матриця коваріації дисперсії для випадкових ефектів, що оцінюються за вектором, має спеціальну форму, що називається складовою симетрією" ( слайд 91 у цій презентації ):

m1 <- lmer(y ~ factor + (0 + factor|group), data)
m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data)

Конкретно Бейтс використовує цей приклад:

library(lme4)
data("Machines", package = "MEMSS")

m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines)
m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines)

з відповідними виходами:

print(m1a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (0 + Machine | Worker)
   Data: Machines
REML criterion at convergence: 208.3112
Random effects:
 Groups   Name     Std.Dev. Corr     
 Worker   MachineA 4.0793            
          MachineB 8.6253   0.80     
          MachineC 4.3895   0.62 0.77
 Residual          0.9616            
Number of obs: 54, groups:  Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917  

print(m2a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (1 | Worker) + (1 | Worker:Machine)
   Data: Machines
REML criterion at convergence: 215.6876
Random effects:
 Groups         Name        Std.Dev.
 Worker:Machine (Intercept) 3.7295  
 Worker         (Intercept) 4.7811  
 Residual                   0.9616  
Number of obs: 54, groups:  Worker:Machine, 18; Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917

Чи може хтось пояснити різницю між моделями та як m1зводиться до m2(заданої симетрії складання) інтуїтивно зрозумілим чином?


6
+1 і, imho, це абсолютно на тему. Проголосуйте за повторне відкриття.
амеба повідомляє Відновити Моніку

2
@ Peter Flom, чому ви вважаєте це питання поза темою?
statmerkur

3
Можливо, було не зрозуміло, що ви питаєте про моделі, а не про lme4синтаксис. Було б корисно - і розширити коло потенційних відповідей - якщо ви пояснили їх людям, незнайомим lme4.
Scortchi

Схоже, йдеться про кодування.
Пітер Флом - Відновити Моніку

1
Якщо це корисно, ось два хороших повідомлення про те, що робить синтаксис lme4, і яка складна симетрія в контексті змішаних моделей (див. Прийняті відповіді на обидва запитання). stats.stackexchange.com/questions/13166/rs-lmer-cheat-sheet and stats.stackexchange.com/questions/15102/…
Яків Соколар

Відповіді:


11

У цьому прикладі є три спостереження за кожною комбінацією трьох машин (A, B, C) та шести робітників. Я буду використовувати для позначення -вимірної матриці ідентичності та для позначення -вимірного вектора з них. Скажімо, - вектор спостережень, який, я вважаю, замовляється працівником, потім машина потім реплікує. Нехай - відповідні очікувані значення (наприклад, фіксовані ефекти), і нехай - вектор групових відхилень від очікуваних значень (наприклад, випадкові ефекти). Умовно на модель для можна записати:Inn1nnyμγγy

yN(μ+γ,σy2I54)

де - "залишкова" дисперсія.σy2

Щоб зрозуміти, як структура коваріації випадкових ефектів індукує структуру коваріації серед спостережень, більш інтуїтивно працювати з еквівалентним «граничним» поданням , яке інтегрується над випадковими ефектами . Граничною формою цієї моделі є,γ

yN(μ,σy2I54+Σ)

Тут - коваріаційна матриця, яка залежить від структури (наприклад, "компоненти дисперсії", що лежать в основі випадкових ефектів). Я буду називати як "граничну" коваріацію.ΣγΣ

У вашому m1випадку випадкові ефекти розкладаються як:

γ=Zθ

Де - матриця проектування, яка відображає випадкові коефіцієнти на спостереження, і - 18-мірний вектор випадкових коефіцієнтів, упорядкований працівником, а потім машиною, і розподіляється як:Z=I1813θT=[θ1,A,θ1,B,θ1,Cθ6,A,θ6,B,θ6,C]

θN(0,I6Λ)

Тут - коваріація випадкових коефіцієнтів. Припущення про складну симетрію означає, що має два параметри, які я назву і , і структуру:ΛΛσθτ

Λ=[σθ2+τ2τ2τ2τ2σθ2+τ2τ2τ2τ2σθ2+τ2]

(Іншими словами, кореляційна матриця, що лежить в основі має всі елементи на позадіагоналі, встановлені на одне значення.)Λ

Гранична структура коваріації, індукована цими випадковими ефектами, є , так що дисперсія даного спостереження є а коваріація між двома (окремими) спостереженнями від працівників та машин є: Σ=Z(I6Λ)ZTσθ2+τ2+σy2i,ju,v

cov(yi,u,yj,v)={0if ijτ2if i=j,uvσθ2+τ2if i=j,u=v

Для вашого m2випадку випадкові ефекти розкладаються на:

γ=Zω+Xη

Де Z як і раніше, - це матриця проектування, яка відображає випадкові перехоплення на одного робітника на спостереження, - 18-мірний вектор випадкових перехоплень для кожної комбінації машини і працівника; і - це 6-мірний вектор випадкових перехоплень для працівника. Вони розподіляються як Де - це дисперсії цих випадкових перехоплювачів.X=I619ωT=[ω1,A,ω1,B,ω1,C,,ω6,A,ω6,B,ω6,C]ηT=[η1,,η6]

ηN(0,ση2I6)
ωN(0,σω2I18)
ση2,σω2

Гранична ковариационная структура m2є , так що дисперсія даного спостереження є , а коваріація між двома спостереженнями працівників та машин є: Σ=σω2ZZT+ση2XXTσω2+ση2+σy2i,ju,v

cov(yi,u,yj,v)={0if ijση2if i=j,uvσω2+ση2if i=j,u=v

Отже ... і . Якщо передбачається складна симетрія (чого вона не відповідає вашому заклику до lmer, оскільки коваріація випадкових ефектів неструктурована). τ 2σ 2 ησθ2σω2τ2ση2 m1

Стислість не є моїм сильним моментом: це все лише довгий, суперечливий спосіб сказати, що кожна модель має два параметри дисперсії для випадкових ефектів і є лише двома різними способами написання однієї і тієї ж "граничної" моделі.

У коді ...

sigma_theta <- 1.8
tau         <- 0.5
sigma_eta   <- tau
sigma_omega <- sigma_theta
Z <- kronecker(diag(18), rep(1,3))
rownames(Z) <- paste(paste0("worker", rep(1:6, each=9)), 
                     rep(paste0("machine", rep(1:3, each=3)),6))
X <- kronecker(diag(6), rep(1,9))
rownames(X) <- rownames(Z)
Lambda <- diag(3)*sigma_theta^2 + tau^2

# marginal covariance for m1:
Z%*%kronecker(diag(6), Lambda)%*%t(Z)
# for m2:
X%*%t(X)*sigma_eta^2 + Z%*%t(Z)*sigma_omega^2

1
Дуже приємна відповідь! Але я думаю, що фраза "машина, яка вкладається в робочий" може ввести в оману, оскільки ті ж три машини з'являються у більш ніж одного (насправді кожного) рівня працівника.
statmerkur

@statmerkur Дякую, я намагався уточнити цей рядок. Повідомте мене, якщо у вас є інша пропозиція.
Нейт-папа

1
Чи слід визначати як ? X = I 61 9XX=I619
S. Catterall Reinstate Monica

1
@ S.Catterall Yup, це друкарська помилка - спасибі за те, що впіймали! Я зафіксував у своїй відповіді.
Нейт Папа

2
@statmerkur Ви можете уточнити, що ви маєте на увазі? Тут немає безперервних коваріатів, тож не знайте, що ви маєте на увазі під нахилом. Як я думаю про модель, полягає в тому, що існують систематичні відмінності середнього рівня реакції між машинами (фіксовані ефекти); потім випадкове відхилення для кожного працівника (випадкові перехоплення / працівник); потім випадкове відхилення для кожної комбінації машино-робочого; і нарешті випадкове відхилення за спостереженням. Чим більша дисперсія випадкових відхилень на одного робітника, тим більше співвіднесені спостереження від даного робітника тощо.
Нейт Папа
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.