Коефіцієнт кореляції внутрішньокласового рівня в змішаній моделі зі випадковими нахилами


10

У мене є такі моделі m_plotзабезпечені lme4::lmerзі схрещеними випадковими ефектами для учасників ( lfdn) і елементів ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Я хочу знати коефіцієнти кореляції між класом (ICC) для учасників та предметів. Завдяки цій чудовій відповіді я в принципі знаю, як отримати ICC для своєї моделі. Однак я не впевнений у тому, включати чи ні довільні нахили:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Яка відповідна міра для співвідношення двох відповідей одного і того ж учасника відповідно до того ж пункту?


1
Мерло та ін 2005 "Короткий концептуальний посібник з багаторівневого аналізу в соціальній епідеміології: дослідження контекстуальних явищ у різних груп людей" може бути корисним посиланням.
N Brouwer

@Henrik Ви коли-небудь знайшли відповідь на це питання? Мені теж цікаво.
Патрік С. Форшер

2
@ PatrickS.Forscher Наскільки я розумію, ICC не має сенсу у випадкових нахилах. Я дізнався це від Джейка Вестфалда.
Генрік

Ви отримали посилання на прочитане відповідне читання випадково?
Патрік С. Форшер

1
@ PatrickS.Forscher Як бачите, Джейк Вестфалл тепер дав чудову відповідь.
Генрік

Відповіді:


8

В основному не існує єдиного числа або оцінки, яка може підсумувати ступінь кластеризації у моделі випадкових нахилів.

Внутрішньокласова кореляція (ICC) може бути записана лише у вигляді простої пропорції дисперсій у моделях, що відповідають лише випадковим перехопленням. Щоб зрозуміти, чому, ескіз виведення виразу ICC можна знайти тут .

Коли ви кидаєте випадкові нахили в рівняння моделі, слідування тим же крокам натомість призводить до виразу ICC на сторінці 5 цього документу . Як бачимо, цей складний вираз є функцією предиктора X. Щоб зрозуміти більш інтуїтивно, чому var (Y) залежить від X, коли є випадкові нахили, перегляньте сторінку 30 цих слайдів ("Чому відхилення залежить від x ? ") .

Оскільки ICC є функцією предикторів (значення x), його можна обчислити лише для окремих наборів значень x. Можливо, ви можете спробувати щось на кшталт звітування МСК на спільному середньому значенні x, але ця оцінка буде очевидно неточною для більшості спостережень.

Все, що я говорив, все ще стосується лише випадків, коли є один випадковий фактор. При безлічі випадкових факторів це стає ще складніше. Наприклад, у мультисайтному проекті, де учасники кожного сайту відповідають на вибірку стимулів (тобто 3 випадкових чинника: сайт, учасник, стимул), ми могли б запитати про багато різних МКЦ: Яка очікувана кореляція між двома відповідями на одній і тій же ділянці, на один і той же стимул, від різних учасників? Як щодо різних сайтів, однакових стимулів та різних учасників? І так далі. @rvl згадує ці ускладнення у відповіді, з якою пов'язана ОП.

Отже, як ви бачите, єдиний випадок, коли ми можемо узагальнити ступінь кластеризації з одним значенням, це випадок, що відповідає лише випадковому фактору випадкового перехоплення. Оскільки це така невелика частка справ у реальному світі, ICC не є корисною більшість часу. Тому моя загальна рекомендація - навіть не хвилюватися за них. Натомість я рекомендую лише повідомити про компоненти дисперсії (бажано у формі стандартного відхилення).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.