Як інтерпретувати дисперсію випадкового ефекту в узагальненій лінійній змішаній моделі

У логістичній узагальненій лінійній змішаній моделі (сімейство = двочлен) я не знаю, як інтерпретувати дисперсію випадкових ефектів:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Як інтерпретувати цей числовий результат?

У мене в багатоцентровому дослідженні є зразок ниркових трансплантованих пацієнтів. Я тестував, чи вірогідність лікування пацієнта певним антигіпертензивним лікуванням серед центрів однакова. Частка лікуваних пацієнтів сильно різниться між центрами, але може бути обумовлена різницею базальних характеристик пацієнтів. Тому я оцінив узагальнену лінійну змішану модель (логістичну), коригуючи основні особливості пацієнтів. Це результати:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 **

Кількісні змінні центрируються. Я знаю, що середньолікарняне стандартне відхилення перехоплення становить 0,6554 за шкалою відхилень. Оскільки перехоплення становить -1,804469, за шкалою відхилень від журналу, то ймовірність лікування антигіпертензивним засобом середнього віку, середнє значення для всіх змінних та імунотерапія А для "середнього" центру становить 14,1% . А тепер починається інтерпретація: при припущенні, що випадкові ефекти слідують за нормальним розподілом, ми очікуємо, що приблизно 95% центрів мають значення в межах 2 стандартних відхилень середнього нуля, тому ймовірність лікуватися для середнього чоловіка буде змінюватися між центрами з інтервалом покриття:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

Це правильно?

Крім того, як я можу перевірити в glmer, якщо мінливість між центрами є статистично значущою? Раніше я працював з MIXNO, чудовим програмним забезпеченням Дональда Хедекера, і там у мене є стандартна помилка дисперсійної оцінки, яку у мене немає в glmer. Як я можу мати ймовірність пройти лікування до «середнього» чоловіка у кожному центрі з довірчим інтервалом?

Дякую

r lme4-nlme

— користувач2310909
джерело

Це, мабуть, найкорисніше, якщо ви будете показувати нам більше інформації про вашу модель, але: вихідне значення показників журналу, залежно від вашої відповіді (наприклад, смертність), залежить від лікарень. Базове значення (термін перехоплення в лікарні) - це коефіцієнт смертності (або будь-який інший) у базовій категорії (наприклад, "необроблений") при нульовому значенні будь-яких безперервних прогнозів. Ця варіація вважається звичайно розподіленою за шкалою відхилень журналу. Середньолікарняне стандартне відхилення перехоплення становить 0,6554; дисперсія (просто стандартне відхилення в квадраті - не міра невизначеності стандартного відхилення) становить . $0.6554^2=0.4295$

(Якщо ви уточнюєте своє запитання / додаєте детальніше про вашу модель, я можу спробувати сказати більше.)

оновлення : ваше тлумачення варіації здається правильним. Точніше,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

Вам слід дати 95% -ний інтервал (не дуже довірчі інтервали, але дуже схожі) для ймовірності базової лінії (чоловіки / середній вік / тощо).

Для перевірки значущості випадкового ефекту у вас є різні варіанти ( для отримання додаткової інформації див. Http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html ). (Зверніть увагу, що стандартна похибка дисперсії RE зазвичай не є надійним способом перевірки значущості, оскільки розподіл вибірки часто перекошений / ненормальний.) Найпростіший підхід - це зробити тест на коефіцієнт ймовірності, наприклад

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

Остаточний поділ на 2 виправляє той факт, що тест відношення ймовірності є консервативним, коли нульове значення (тобто відхилення RE = 0) знаходиться на межі можливого простору (тобто дисперсія RE не може бути <0).

— Бен Болкер
джерело

Я відредагував питання

— користувач2310909

Спасибі, приємно читати тому, хто добре знає тему.

— користувач2310909