Що таке R-структура G-структури в glmm?


16

Я MCMCglmmнещодавно використовував пакунок. Мене бентежить те, що в документації згадується як R-структура та G-структура. Вони, мабуть, стосуються випадкових ефектів - зокрема, із зазначенням параметрів попереднього розподілу на них, але, як видається, в документації передбачається, що читач знає, що це за терміни. Наприклад:

необов'язковий перелік попередніх специфікацій, що містить 3 можливі елементи: R (R-структура) G (структура G) і B (фіксовані ефекти) ............ Пріоритети для дисперсійних структур (R і G ) - це списки з очікуваними (спів) відхиленнями (V) та параметром ступеня вірування (nu) для зворотного-Вішарта

... взяті звідси .

EDIT: Зауважте, що решту запитань я переписав після коментарів Stephane.

Чи може хтось пролити світло на те, що таке R-структура та G-структура, в контексті простої моделі дисперсійних компонентів, де лінійний предиктор з e 0 i jN ( 0 , σ 2 0 e ) і u 0 jN ( 0 , σ 2 0 u )

β0+e0ij+u0j
e0ijN(0,σ0e2)u0jN(0,σ0u2)

Я зробив наступний приклад з деякими даними, які поставляються разом MCMCglmm

> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8529   0.2951    1.455      160

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units         1        1        1        0

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1630  -1.4558  -0.8119    463.1 <0.001 ***
---

> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8325   0.3101    1.438    79.25

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units    0.7212  0.04808    2.427    3.125

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1042  -1.5191  -0.7078    20.99 <0.001 ***
---

> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation 
Formula: Pupated ~ 1 + (1 | FSfamily) 
   Data: PlodiaRB 
  AIC  BIC logLik deviance
 1020 1029   -508     1016
Random effects:
 Groups   Name        Variance Std.Dev.
 FSfamily (Intercept) 0.56023  0.74849 
Number of obs: 874, groups: FSfamily, 49

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -0.9861     0.1344  -7.336  2.2e-13 ***

Отже, грунтуючись на коментарях Стефана, я думаю, що структура G для . Але коментарі також говорять про те, що структура R є для σ 2 0 e, але, схоже, це не з'являється уσ0u2σ0e2lme4 висновку.

Зауважте, що результати з lme4/glmer()цих даних узгоджуються з обома прикладами MCMCMCMCglmm .

Отже, чи є структура R для і чому це не відображається у висновку ?σ0e2lme4/glmer()


1
З термінологією SAS (але це, можливо, більш поширена термінологія) матриця G - це матриця дисперсії випадкових ефектів, а матриця R - матриця дисперсії "термінів помилок" (у вашому випадку, можливо, це оціночна залишкова кількість) дисперсія ?)σ0e2
Стефан Лоран

@ StéphaneLaurent дякую Мені було цікаво, чи може це бути оцінено але коли я вперше дізнався про узагальнену лінійну модель, я пам'ятаю, що σ 2 0 eσ0e2σ0e2 не оцінюється - обчислюється лише "відхилення" (як і у випадку lme4). Можливо, мені щось не вистачає?
Джо Кінг

1
можливо, сенс залишкової дисперсії не зрозумілий, коли сім'я розподілу не гауссова
Stéphane Laurent

1
@ Stéphane Laurent Так! Будь ласка, дивіться мій коментар до відповіді Майкла хвилину тому - для двійкового результату це має бути зафіксовано (як у моїх моделях у моїй ОП)
Джо Кінг,

1
Якщо у вас є модель ME / Multilevel, є кілька варіантів. Уявіть найпростіший випадок: . Існує розбіжність у перехопленнях b i та в помилці ε i . G часто використовується для матриці вар-ковара випадкових ефектів (у цьому випадку скаляр, σ 2 b ) таYi=β0+β1X+bi+εibiεiGσb2 - для матриці вар-ковара залишкових дисперсій ε iRiεiпісля обліку фіксованих & випадкових ефектів кластера. Зазвичай він мислиться як діагональна матриця 's. Крім того, обидві дисти вважаються багатоваріантними нормальними w / середніми = 0. σ2
gung - Відновіть Моніку

Відповіді:


8

Я хотів би розмістити свої коментарі нижче як коментар, але цього буде недостатньо. Це питання, а не відповідь (попросту до @gung, я не відчуваю себе досить сильно на тему).

Мені здається, що MCMCglmm не реалізує "справжній" байєсівський glmm. Справжня байєсівська модель описана у розділі 2 цієї статті . Аналогічно частостістській моделі, має ( E ( y u ) ) = X β + Z u, а також необхідний попередній параметр дисперсії ϕ 1, крім фіксованих параметрів βg(E(yu))=Xβ+Zuϕ1β та дисперсії "G" випадковий ефект .u

Але відповідно до цієї віньетки MCMCglmm модель, реалізована в MCMCglmm, задається , і вона не включає параметр дисперсії ϕ 1g(E(yu,e))=Xβ+Zu+eϕ1 . Це не схоже на класичну модель часто.

Тому я не був би здивований, що немає аналога σe з glmer.

Вибачте, будь ласка, за ці грубі коментарі, я просто коротко подивився на це.


σeglmerMCMCglmmMCMCglmmϕ1

Вибачте, мої слова були не зовсім підходящими. MCMCglmm справді байєсівський, але він точно не реалізує класичний glmm (я думаю). Крім того, ви повинні знати, що важко встановити пріори, роблячи висновок про компоненти дисперсії, близькі до частотного виводу.
Стефан Лоран

Знову дякую. Під час свого вивчення я виявив, що я можу використовувати за замовчуванням розподіл зворотної частоти для компонентів дисперсії при MCMCglmmвикористанні різних параметрів, і 95% достовірні інтервали завжди містять значення дисперсії для оцінки випадкових ефектів, glmerтому я вважав, що це було розумно , але як слід інтерпретувати цей випадок, який може бути не типовим, коли результат, що MCMCglmmінтервали не дуже чутливі до вибору попереднього? Можливо, я повинен поставити нове запитання з цього приводу?
Джо Кінг

Можливо, у вас великий розмір вибірки? Що стосується вашого первинного запитання, я маю враження, що принаймні для двочленного випадку модель glmer еквівалентна моделі MCMCglmm зσе=0. Що станеться, якщо встановити попереднє значенняσе сильно зосереджена в 0?
Стефан Лоран

Так, у мене досить великий розмір вибірки: 50 000 спостережень у 225 кластерах (мої власні дані, а не приклад у моєму запитанні). Коли я встановив попередній дуже концентрований близько нуляσе, встановивши V = 0,01 і nu = 100, тоді я отримаю 0,25 (CI: 0,16, 0,29) для σе і 0,53 (0,38, 0,73) для σу. Коли я встановив менш інформативний попередній показник з V = 10 і nu = 0,01, тоді я отримую 0,18 (0,12, 0,23) і 0,49 (0,34, 0,63) відповідно. Це порівнюється з 0,51 від glmer. Я навіть спробував попередньо неправильну квартиру, яка дала 0,10 (0,08, 0,13) та 0,47 (0,25, 0,68).
Джо Кінг

11

Я запізнююсь на гру, але кілька зауважень. TheRструктура - це залишкова структура. У вашому випадку "структура" має лише один елемент (але це не повинно бути). Для змінної реакції Гаусса залишкова дисперсія,σе2зазвичай оцінюється. Для двійкових результатів він вважається постійним. Через те, як налаштовано MCMCglmm , ви не можете його виправити на нулі, але це відносно стандартно1(також справедливо для пробіт-моделі). Для підрахунку даних (наприклад, з розподілом пуассона) ви їх не виправляєте, і це автоматично оцінює параметр перевищення дисперсії.

The Гструктура - це структура випадкових ефектів. Знову ж таки у вашому випадку - лише випадковий перехоплення, але якби у вас було кілька випадкових ефектів, вони утворювали б матрицю дисперсії та коваріації,Г.

Остаточне зауваження, оскільки залишкова дисперсія не зафіксована в нулі, оцінки не збігаються з показниками з glmer. Вам потрібно змінити їх масштаб. Ось невеликий приклад (не використовуючи випадкових ефектів, але він узагальнює). Зверніть увагу, як дисперсія структури R закріплена на рівні 1.

# example showing how close the match is to ML without separation
m2 <- MCMCglmm(vs ~ mpg, data = mtcars, family = "categorical",
  prior = list(
    B = list(mu = c(0, 0), V = diag(2) * 1e10),
    R = list(V = 1, fix = 1)),
  nitt = 1e6, thin = 500, burnin = 10000)
summary(m2)

Ось константа масштабування для двочленної родини:

k <- ((16*sqrt(3))/(15*pi))^2

Тепер розділіть рішення за ним і отримайте режими заднього ходу

posterior.mode(m2$Sol/(sqrt(1 + k)))

Що має бути досить близьким до того, що ми отримуємо glm

summary(glm(vs ~mpg, data = mtcars, family = binomial))

чи трапляється вам знати, як визначити гетерокедастичність на першому рівні в MCMCglmm? Це R-структура? Що таке синтаксис?
Максим.К

@ Джошуа, чи можете ви пояснити "постійну шкалу для двочленної сім'ї"? PS: Для насіння 123я отримую (з поправкою) m2значення -8.164та 0.421; і від glmзначень -8.833і 0.430.
Qaswed

Константа масштабування може бути знайдена в Diggle et et. ін. ( amazon.de/Analysis-Longitudinal-Oxford-Statistic-Science/dp/… ) - згідно cran.r-project.org/web/packages/MCMCglmm/vignettes/… eq. 2.14 на сторінці 47.
Qaswed
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.