Що було б наочним малюнком для лінійних змішаних моделей?


17

Скажіть, що ви перебуваєте в бібліотеці вашого відділу статистики, і ви натрапили на книгу із наступним малюнком на головній сторінці.

введіть тут опис зображення

Ви, мабуть, подумаєте, що це книга про речі з лінійною регресією.

Якою була б картина, яка змусила б задуматися про лінійні змішані моделі?

Відповіді:


12

Для розмови я використав наступне зображення, яке базується на sleepstudyнаборі даних із пакету lme4 . Ідея полягала в тому, щоб проілюструвати різницю між незалежними регресійними приступами від суб'єкт-даних (сірі) від прогнозів моделей випадкових ефектів, особливо, що (1) передбачувані значення з моделі випадкових ефектів є оцінками усадки і що (2) траєкторії індивідів діляться загальний нахил із моделлю, що перехоплюється лише випадковим чином (помаранчевий). Розподіли предметних перехоплень відображаються як оцінки щільності ядра на осі у ( код R ).

введіть тут опис зображення
(Криві щільності виходять за межі діапазону спостережуваних значень, оскільки спостережень порівняно мало.)

Більш «звичайною» графікою може бути наступна, яка є від Doug Bates (доступна на сайті R-forge для lme4 , наприклад, 4Longitudinal.R ), де ми могли б додавати окремі дані на кожній панелі.

введіть тут опис зображення


+1. Хороший! Я думаю, що ваш перший сюжет чудовий на концептуальному рівні. Мій єдиний коментар - це те, що він вимагає значно більше пояснень, ніж стандартний "наївний" сюжет, і якщо аудиторія не дотягує до концепцій моделей LME і поздовжніх даних, це може пропустити точку сюжету. Я, безумовно, запам'ятаю це для твердої "розмови про статистику", хоча. (Я вже декілька разів бачив другий сюжет у "книзі lme4". Я тоді не надто був вражений, і зараз теж не надто вражений ")
usεr11852 говорить Reinstate Monic

@chl: Дякую! Я виберу серед пропозицій. Тим часом +1
ocram

@ user11852 Моє розуміння моделі RI полягає в тому, що оцінки OLS є правильними, але їх стандартні помилки не є (через відсутність незалежності), так що окремі прогнози також будуть невірними. Зазвичай я б показував загальну лінію регресії, передбачаючи незалежні спостереження. Тоді теорія говорить нам, що поєднання умовних режимів випадкових ефектів та оцінок фіксованих ефектів дає умовні режими коефіцієнтів всередині предмета, і буде мало скрекінга, коли статистичні одиниці різні, або коли вимірювання точні, або з великі зразки.
chl

у|γN(Хβ+Zγ,σ2Я)уN(Хβ,ZDZТ+σ2Я)

Посилання на код R для створення малюнка порушено. Мені було б цікаво, як намалювати розподіли вертикально на малюнку.
Niels Hameleers

8

Тож щось не "надзвичайно елегантне", але показуючи випадкові перехоплення та нахили теж із R. (я думаю, було б ще крутіше, якби показали й фактичні рівняння) введіть тут опис зображення

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()

Спасибі! Я зачекаю ще трохи на потенційні нові відповіді ... але я можу будувати на цьому.
окрам

Я трохи заплутаний у вашій фігурі, тому що правий субплот виглядає на мене так, ніби окрема лінія регресії підходить до кожної групи. Чи не вся справа в тому, що змішані набори моделей повинні відрізнятися від незалежних підходів для кожної групи? Можливо, вони є, але в цьому прикладі насправді важко помітити, чи я щось пропускаю?
амеба каже, що поверніть Моніку

2
Так, коефіцієнт різний . Ніп; окрема регресія не підходила для кожної групи. Показані умовні пристосування. У ідеально врівноваженому, гомоскедастичному дизайні, як цей, різницю буде важко помітити, наприклад, умовний перехоплення групи 5 становить 2,96, тоді як незалежний перехоплення на групу становить 3,00. Це структура коваріації помилок, яку ви змінюєте. Перевірте також відповідь чі, в ньому більше груп, але навіть там, у дуже мало випадках, візуально "сильно відрізняється".
usεr11852 повідомляє Відновити Моніку

6

Не моя робота

Цей графік, узятий з документації Matlab про nlmefit, вражає мене, як це дійсно ілюструє концепцію випадкових перехоплення та нахилів. Можливо, щось, що демонструє групи гетерокедастичності у залишках графіку OLS, було б також досить стандартним, але я не дав би "рішення".


Дякуємо за вашу пропозицію. Хоча це виглядає як змішані речі з логістичної регресії, я думаю, я можу це легко адаптувати. Чекаю ще пропозицій. Тим часом +1. Знову дякую.
окрам

Схоже, це змішана логістична регресія здебільшого тому, що вона одна ... :) Це був перший сюжет, який насправді вискакував у мене! Я дам щось чисто R-ish у другій відповіді.
usεr11852 повідомляє Відновити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.