отримання ступеня свободи від lmer


11

Я підходив до lmer-моделі із наступним (хоча і складеним результатом):

Random effects:
 Groups        Name        Std.Dev.
 day:sample (Intercept)    0.09
 sample        (Intercept) 0.42
 Residual                  0.023 

Я дуже хотів би побудувати інтервал довіри для кожного ефекту, використовуючи наступну формулу:

(n1)s2χα/2,n12,(n1)s2χ1α/2,n12

Чи є спосіб зручно дістати ступеня свободи?


1
Я думаю, ви хочете перевірити lmerTest . Є цілий ряд наближень для апроксимації ФРА в моделі змішаних ефектів для фіксованих ефектів (наприклад. Саттервейт , Kenward Роже і т.д.) У вашому випадку це здається мені , що ви ускладнювати своє життя. Ви вважаєте, що кожен ефект є гауссовим. Просто використовуйте стандартне відхилення, щоб отримати впевнений інтервал на ваш вибір.
usεr11852

3
@ usεr11852 У моделі зі змішаними ефектами ви припускаєте, що кожен ефект є гауссова, але параметр - дисперсія гауссового розподілу, а не середня. Таким чином, розподіл його оцінювача буде дуже перекошеним, і нормальний інтервал довіри відхилень стандартних відхилень не буде відповідним.
Карл Ове Хаффхаммер

1
@KarlOveHufthammer: Ви маєте рацію вказати на це; Я бачу, що ви маєте на увазі (і, мабуть, ОП). Я вважав, що його турбують засоби та / або реалізація випадкових ефектів, коли він згадував про ступінь свободи.
usεr11852

ступінь свободи "проблематична" для змішаних моделей, див .: stat.ethz.ch/pipermail/r-help/2006-May/094765.html та stats.stackexchange.com/questions/84268/…
Тім

Відповіді:


17

Я б замість цього просто створив довірчі інтервали вірогідності профілю . Вони надійні і їх дуже легко обчислити, використовуючи пакет 'lme4'. Приклад:

> library(lme4)
> fm = lmer(Reaction ~ Days + (Days | Subject),
            data=sleepstudy)
> summary(fm)
[]
Random effects:
 Groups   Name        Variance Std.Dev. Corr
 Subject  (Intercept) 612.09   24.740       
          Days         35.07    5.922   0.07
 Residual             654.94   25.592       

Тепер ви можете обчислити довірчі інтервали вірогідності профілю за допомогою confint()функції:

> confint(fm, oldNames=FALSE)
Computing profile confidence intervals ...
                               2.5 %  97.5 %
sd_(Intercept)|Subject        14.381  37.716
cor_Days.(Intercept)|Subject  -0.482   0.685
sd_Days|Subject                3.801   8.753
sigma                         22.898  28.858
(Intercept)                  237.681 265.130
Days                           7.359  13.576

Ви також можете використовувати параметричний завантажувальний інструмент для обчислення довірчих інтервалів. Ось синтаксис R (використовуючи parmаргумент для обмеження параметрів, для яких потрібні інтервали довіри):

> confint(fm, method="boot", nsim=1000, parm=1:3)
Computing bootstrap confidence intervals ...
                              2.5 % 97.5 %
sd_(Intercept)|Subject       11.886 35.390
cor_Days.(Intercept)|Subject -0.504  0.929
sd_Days|Subject               3.347  8.283

Результати, природно, дещо відрізнятимуться для кожного циклу. Ви можете збільшити, nsimщоб зменшити цей варіант, але це також збільшить час, необхідний для оцінки довірчих інтервалів.


1
Гарна відповідь (+1). Я також зазначив той факт, що в цьому випадку також можна отримати CI з параметричної завантажувальної програми . Ця тема містить дуже цікаву дискусію з цього питання.
usεr11852

@ usεr11852 Дякую за пропозицію. Зараз я додав приклад за допомогою параметричного завантажувального пристрою.
Karl Ove Hufthammer

6

Ступені свободи для змішаних моделей "проблемні". Для більш детального ознайомлення з ним ви можете перевірити значення lmer, p-значення та все, що написав Дуглас Бейтс. Також FAQ-r-sig-змішані моделі резюмує причини, чому це набридає:

  • Взагалі не ясно, що нульовий розподіл обчисленого співвідношення сум квадратів дійсно є розподілом F для будь-якого вибору ступенів свободи знаменника. Хоча це справедливо і для особливих випадків, які відповідають класичним експериментальним конструкціям (вкладені, розбиті графіки, рандомізований блок тощо), але, очевидно, не вірно для більш складних конструкцій (неврівноважені, GLMM, часові або просторові кореляції тощо).
  • Для кожного запропонованого простого рецепта ступеня свободи (слід матриці капелюхів тощо), здається, є принаймні один досить простий контрприклад, де рецепт погано виходить з ладу.
  • Інші схеми наближення df, які були запропоновані (Satterthwaite, Kenward-Roger тощо), очевидно, були б досить важкими для реалізації в lme4 / nlme,
    (...)
  • Тому що первинні автори lme4 не впевнені в корисності загального підходу тестування з посиланням на приблизний нульовий розподіл, а також через накладні витрати будь-кого іншого, що копається в коді, щоб включити відповідну функціональність (як патч або додаток -на) ця ситуація навряд чи зміниться в майбутньому.

FAQ надає також деякі варіанти

  • використовувати MASS :: glmmPQL (використовує старі правила nlme, приблизно еквівалентні правилам SAS "внутрішній і зовнішній") для GLMM, або (n) lme для LMM
  • Відгадайте знаменник df із стандартних правил (для стандартних конструкцій) та застосуйте їх до t або F тестів
  • Запустіть модель у lme (якщо можливо) та використовуйте знаменник df, про який повідомляється (що дотримується простого правила «внутрішній-зовнішній», який повинен відповідати канонічній відповіді для простих / ортогональних конструкцій), застосованих до тестів t або F. Про чіткі конкретизації правил, які використовує lme, див. Сторінку 91 Піньейро та Бейтса - ця сторінка доступна в Книгах Google
  • використовувати SAS, Genstat (AS-REML), Stata?
  • Припустимо, нескінченний знаменник df (тобто тест Z / chi-квадрата, а не t / F), якщо кількість груп велике (> 45? Встановлено різні правила великого розміру для того, наскільки великою є "приблизно нескінченна"), у тому числі [в англірських та пішке '' Здебільшого нешкідливі економетрики ''], 42 (в пошану Дугласу Адамсу)

Але якщо вас цікавлять інтервали довіри, є кращі підходи, наприклад, засновані на завантажувальній програмі, як запропонував у своїй відповіді Карл Ове Хаффхаммер , або ті, запропоновані у FAQ.


"Відгадайте знаменник df із стандартних правил (для стандартних конструкцій) і застосуйте їх до t або F тестів"; Мені б дуже хотілося, щоб хтось міг детальніше розглянути це. Наприклад, для вкладеної конструкції (наприклад, пацієнтів проти контрольних груп, кілька зразків на кожну особу; ідентифікатор суб'єкта є випадковим ефектом), як ми отримуємо ступеня свободи для такої конструкції?
Арно А
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.