Чому моделі змішаних ефектів вирішують залежність?


14

Скажіть, нас цікавить, як на оцінку студентських іспитів впливає кількість годин, які вивчають ці студенти. Щоб дослідити цей взаємозв'язок, ми могли б запустити таку лінійну регресію:

exam.gradesi=a+β1×hours.studiedi+ei

Але якщо ми відіб’ємо учнів з кількох різних шкіл, ми можемо очікувати, що учні в одній школі будуть більш схожими один на одного, ніж учні з різних шкіл. Щоб вирішити цю проблему залежності, порада в багатьох підручниках / в Інтернеті полягає в тому, щоб запустити змішані ефекти і вступити до школи як випадковий ефект. Тож модель стала б:

exam.gradesi=a+β1×hours.studiedi+schoolj+ei
Але чому це вирішує задачу залежності, яка була присутня в лінійній регресії?

Будь ласка, відповідайте так, ніби ви розмовляєте з 12-річним


Незалежно від того, чи "вона вирішує", проблема залежності залежить від контексту. Але ви, напевно, можете бачити, що зараз розширена модель має термін, який може, принаймні частково, пояснювати ефект, пов'язаний з певною школою.
image_doctor

Відповіді:


23

Включення випадкових термінів у модель - це спосіб індукувати деяку структуру коваріації між класами. Випадковий коефіцієнт для школи викликає ненульову коваріацію між різними учнями однієї школи, тоді як це коли школа відрізняється.0

Запишемо вашу модель як де s індексує школу, а i індексує учнів (у кожній школі). Терміни школа s - незалежні випадкові величини, намальовані в N ( 0 , τ ) . В е з , я незалежні випадкові величини , зроблені в N ( 0 , сг

Ys,i=α+hourss,iβ+schools+es,i
sischoolsN(0,τ)es,i .N(0,σ2)

Цей вектор очікував значення

[α+hourss,iβ]s,i
визначається кількістю відпрацьованих годин.

Коваріація між та Y s , i дорівнює 0, коли s s Ys,iYs,i0ss , що означає, що відхилення оцінок від очікуваних значень не залежить, коли учні не в одній школі.

Коваріація між і Y з , я ' є τ , коли я I ' , а дисперсія Y s , я це τ + σ 2Ys,iYs,iτiiYs,iτ+σ2 : ранги студентів з тих же шкіл будуть корелювати відхилення від очікуваних значень .

Приклад та змодельовані дані

Ось коротке моделювання R для п’ятдесяти учнів п’яти шкіл (тут я беру ); імена змінної є самодокументуванням: σ2=τ=1

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

schools+es,i

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

змішана модель

schoolsα+hoursβ , оцінка визначається часом, витраченим на роботу. Як результат, учні однієї школи схожі між собою, ніж учні різних шкіл, як ви заявили у своєму запитанні.

Матриця дисперсії для цього прикладу

schoolses,i

[A00000A00000A00000A00000A]
10×10A
A=[2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112].

1
Elvis: thats probably a great answer for people more versed in statistics than I. However I can extract little meaning from it. Could you edit your response in a way that a 12 year old might be able to understand?
luciano

1
A... 12 years old?! Wow! I will add some simulations, if this can help.
Elvis

5
Done. Hope this helps. If not, please be more specific about what you don’t get. Note that a 12 yo would not understand the question either... you can’t ask for an answer simpler than the question.
Elvis
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.