Інтерпретація дисперсії випадкових ефектів у glmer


13

Я переглядаю статтю про запилення, де дані розподілені біноміально (фрукти дозрівають чи ні). Тому я використовував glmerодин випадковий ефект (окрема рослина) та один фіксований ефект (лікування). Рецензент хоче дізнатися, чи вплинула рослина на набір фруктів - але у мене виникають проблеми з інтерпретацією glmerрезультатів.

Я читав в Інтернеті, і, здається, можуть бути проблеми з безпосередньо порівнянням glmта glmerмоделями, тому я цього не роблю. Я вважав, що найпростішим способом відповісти на питання було б порівняння дисперсії випадкових ефектів (1.449, нижче) із загальною дисперсією або дисперсії, поясненої лікуванням. Але як обчислити ці інші відхилення? Вони, схоже, не включаються до результатів нижче. Я читав щось про залишкові дисперсії, які не включаються до двочленних glmer- як я інтерпретую відносну важливість випадкового ефекту?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

Відповіді:


12

Хоча отримання аналогу "дисперсії пропорцій, поясненого кожним ефектом" в принципі можлива для ГЛМ, є кілька ускладнюючих факторів (які рівні моделі ви вважаєте "сумарною дисперсією", і як ви кількісно оцінюєте варіацію вибірки за рахунок розподіл вибірки найнижчого рівня [Біноміальний у даному випадку]? Nakagawa та Schielzeth (doi: 10.1111 / j.2041-210x.2012.00261.x) представляють загальний підхід до обчислення R ^ 2 (частка загальної дисперсії, поясненої) для (G) ЛММ, що набув досить великої популярності в екології; Сю та ін 2003 рокувикористовувати аналогічний підхід. В принципі, цей підхід, ймовірно, може бути розширений, щоб врахувати пропорцію дисперсії, пояснену різними термінами [але зауважте, що "частка дисперсії" всіх термінів у розглянутій таким чином моделі, ймовірно, не складе до 100% - це може будь або більше, або менше].

4σ1.96σ+1.96σ

Візуально:

введіть тут опис зображення


R2

1
Я просто говорив, що не думаю, що це божевільне або обов'язково недобре поставлене питання. Але і ієрархічна структура, і GLM-подібні моделі відкривають банки з хробаками, які ускладнюють вибір відповіді. Зазвичай я не турбуюсь, але я можу зрозуміти, чому люди хотіли б спробувати знайти цифри, які вимірювали доброту придатності або відносну важливість термінів у моделі, розумним чином.
Бен Болкер

Це розумно. До речі, як ви думаєте про моє припущення, що з 10 рослин, 3 обробки та N = 30 ОП може відповідати моделі, використовуючи як фіксовані ефекти? Я, звичайно, не думаю, що це була б правильна кінцева модель, звичайно, але це вражає мене як потенційно допустимий спосіб перевірити, чи є різниці між рослинами, і поставити обидві змінні на подібні основи для порівняння.
gung - Відновіть Моніку

мені здається розумним.
Бен Болкер

Я підходив до моделі як для лікування, так і для рослини як фіксованих ефектів, як запропонував Гунг, і термін рослини мав дуже високе p-значення (p = 0,3). Чи здається це дивним, враховуючи, що, як ви кажете, "передбачуване середнє серед рослинного походження становить 1,20, дуже близьке за величиною найбільшого ефекту лікування (-1,18)"? Чому воно виявилося б як незначне в ANOVA з двома фіксованими ефектами?
jwb4

3

PlantID0

У вашому випадку у вас є кілька заходів на рослину, тому одним швидким і брудним підходом є запуск моделі з PlantIDфіксованим ефектом і перевірка цього ефекту.


1

Проста відповідь рецензента: "Так". Якщо він просить перевірити, чи суттєво відрізняється дисперсія випадкового ефекту від 0, у вас є пара варіантів. Зауважте, що багатьом розумним людям незручно перевіряти, якщо відхилення випадкових ефектів відрізняються від 0.

Найпростішим є тест на коефіцієнт ймовірності, хоча більшість не рекомендується. Вони дуже консервативні при тестуванні на кордонах (тобто ви протестуєте проти відхилення 0, яке може бути найменшим). Існує правило, що значення р приблизно вдвічі більше, ніж воно є насправді.

Метод, який рекомендується в більшості місць, - це параметрична завантажувальна програма. Ви можете використовувати bootMerз lme4пакета. Переконайтеся, що встановлено параметр REML вашої функції lmer на FALSE, інакше ваша дисперсія буде більшою ніж 0 100% часу (або близька до неї ... насправді вона, ймовірно, буде більше 0 майже 100% час все одно).

Деякі поради та подальші ресурси:

http://glmm.wikidot.com/faq (знайти як я можу перевірити, чи є випадковий ефект вагомим? заголовок)

lmer () тестування параметричного завантажувального пристрою для фіксованих ефектів

http://www.r-bloggers.com/using-bootmer-to-do-model-comppare-in-r/


Дякуємо за цей чіткий (та швидкий!) Посібник для порівняння моделей. Але як би я інтерпретував "величину" ефекту випадкової величини? тобто, як би я порівняв дисперсію, пояснену моєю випадковою змінною, до дисперсії, поясненої фіксованою змінною (лікування)? Я думаю, я не бачу, як це вибирається з результатів завантаженого LRT тесту.
jwb4

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.