На практиці як обчислюється матриця коваріації випадкових ефектів у моделі змішаних ефектів?


19

В основному, мені цікаво, як застосовуються різні структури коваріації та як обчислюються значення всередині цих матриць. Такі функції, як lme (), дозволяють нам вибрати, яку структуру ми б хотіли, але я хотів би знати, як вони оцінюються.

Розглянемо модель лінійних змішаних ефектів .Y=Xβ+Zu+ϵ

Де і . Крім того:ϵ d N ( 0 , R )udN(0,D)ϵdN(0,R)

Var(Y|X,Z,β,u)=R

Var(Y|X,β)=ZDZ+R=V

Для простоти будемо вважати .R=σ2In

В основному моє запитання: як саме оцінюється з даних для різних параметрів? Скажімо, якщо припустити, що є діагональним (випадкові ефекти незалежні) або повністю параметризований (випадок, який мене на даний момент більше цікавить) або будь-який з інших параметрів? Чи є для них прості оцінки / рівняння? (Це, без сумніву, буде ітеративно оцінено.)D DDDD

EDIT: Із книги «Компоненти варіації» (Searle, Casella, McCulloch 2006) мені вдалося просвітити наступне:

Якщо то компоненти дисперсії оновлюються та обчислюються наступним чином:D=σu2Iq

σu2(k+1)=u^Tu^σu2(k)trace(V1ZTZ)

σe2(k+1)=Y(YXβ^(k)Zu^(k))/n

Де і є -ми оновленнями відповідно. у (до)доβ^(k)u^(k)k

Чи існують загальні формули, коли - діагональна або повністю параметризована? Я здогадуюсь у повністю параметризованому випадку розклад Холеського використовується для забезпечення позитивної визначеності та симетрії.D


2
arxiv.org/pdf/1406.5823 (у пресі в Журналі статистичного програмного забезпечення ) може бути корисним ...
Бен Болкер

Відповіді:


8

Пов'язаний Goldstein .pdf @probabilityislogic - це чудовий документ. Ось список деяких посилань, які обговорюють ваше конкретне питання:

Харвілл, 1976: Розширення теореми Гаусса-Маркова на включення оцінки випадкових ефектів .

Harville, 1977: Максимальна ймовірність підходів до оцінки компонентів дисперсії та пов'язаних з цим проблем .

Laird and Ware, 1982: Моделі випадкових ефектів для поздовжніх даних .

McCulloch, 1997: Максимальні алгоритми ймовірності для узагальнених лінійних змішаних моделей .

Керівництво SAS користувача Уривок для змішаної процедури має багато інформації про оцінці коваріації і багатьох джерелах більш (починаючи зі стор 3968).

Існує численні підручники з якості аналізу даних по поздовжніх / повторних заходах, але ось дещо детальніше про впровадження в R (від авторів lme4та nlme):

Pinheiro and Bates, 2000: Моделі змішаних ефектів у S та S-PLUS .

EDIT : Ще один релевантний документ: Lindstrom and Bates, 1988: Алгоритми Ньютона-Рафсона та Е. М. для лінійних моделей змішаних ефектів для даних повторних заходів .

EDIT 2 : І ще: Jennrich and Schluchter, 1986: Неврівноважені моделі повторних заходів зі структурованими матрицями коваріації .


Я дивився на Піньейру та Бейтса, зокрема на Розділ 2 (з теорії та обчислень), але я, здається, нічого не проглядав, як застосовується та оцінюється структура коваріації? Я незабаром перейду над цим знову. У мене є кілька цих паперів, які просто сидять тут, я їх обов'язково повинен прочитати ще раз. Ура.
dcl

1
@dcl Озираючись до розділу 2 P&B, я бачу, що вони можуть переглядати деякі етапи, які вас цікавлять (вони згадують про оптимізацію параметрів коваріації вірогідності журналу, але не кажуть як ). Зважаючи на це, розділ 2.2.8 може бути розділом, який найкращим чином відповідає на ваше питання.

1
@dcl Додано ще одне джерело, яке може допомогти.

дякую за посилання. Я раніше переглядав ці документи, деякі з них для мене досить технічні. Я зараз перегляну їх, але на перший погляд я не можу отримати від них те, що хочу.
dcl

1
@dcl Вибачте за стіну посилань, але ваше питання полягає в тому, що людина може провести пару повних лекцій, обговорюючи (це дуже хороший питання, який начебто підковується під килим, коли вперше дізнаєтесь про моделі зі змішаними ефектами). Окрім плавання в літературі, одне, що можна зробити, - це подивитися на вихідний код lme4і подивитися, як він стосується цієї оцінки.

7

Гарві Голдштейн - непогане місце для початку.

Як і у більшості складних методів оцінки, вона залежить від програмного пакету. Однак часто те, що робиться, відбувається в наступних кроках:

  1. Виберіть початкове значення для (скажімо ) та (скажімо, ). ВстановітьD 0 R R 0 i = 1DD0RR0i=1
  2. Умовно і , оцініть і та . Виклик оцінки і і . R = R i - 1 β u ϵ β i u i ϵ iD=Di1R=Ri1βuϵβiuiϵi
  3. При умови, і і , оцінка і . Назвіть оцінки та u = u i ϵ = ϵ i D R D i R iβ=βiu=uiϵ=ϵiDRDiRi
  4. Перевірка на конвергенцію. Якщо не конвергується, встановіть і поверніться до кроку 2i=i+1

Одним простим і швидким методом є IGLS, який заснований на ітерації між двома процедурами найменших квадратів, і детально описаний у другій главі. Недоліком є ​​те, що він не працює добре для дисперсійних компонентів, близьких до нуля.


Я знаю, що це загальний метод, але як оцінюються D і R, які рівняння використовуються для різних структур? Які хороші початкові значення? Я перевірю pdf зараз, ура.
dcl


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.