Залишкова діагностика та однорідність дисперсій у лінійній змішаній моделі


10

Перш ніж задавати це питання, я здійснив пошук на нашому сайті і знайшов багато подібних питань (наприклад, тут , тут і тут ). Але я вважаю, що на ці пов’язані питання недостатньо відповіли чи обговорили, тому я хотів би знову поставити це питання. Я вважаю, що має бути велика кількість аудиторії, яка бажає, щоб подібні питання були пояснені більш чітко.

Для моїх питань спочатку розглянемо лінійну модель змішаних ефектів,

y=Xβ+Zγ+ϵ
де Xβ є лінійною складовою фіксованих ефектів, Z є додатковою матрицею , відповідна конструкції в цих параметри випадкових ефектів , γ . І ϵ  N(0,σ2Я) - звичайний термін помилки.

Припустимо, єдиним фактором з фіксованою дією є категорична змінна Лікування , що має 3 різних рівня. І єдиним фактором випадкових ефектів є змінна Subject . Однак, у нас є змішана модель із фіксованим ефектом лікування та випадковим суб'єктом.

Мої запитання, таким чином:

  1. Чи існує однорідність припущення дисперсії в лінійній змішаній моделі, аналогічна традиційним моделям лінійної регресії? Якщо так, що конкретно означає припущення у контексті задачі лінійної змішаної моделі, зазначеної вище? Які ще важливі припущення, які потрібно оцінити?

Мої думки: ТАК. припущення (я маю на увазі нульову середню помилку та рівну дисперсію) все ще звідси: . У традиційній лінійній регресійній моделі можна сказати, що припущення полягає в тому, що "дисперсія помилок (або просто дисперсія залежної змінної) є постійною на всіх 3 рівнях лікування". Але я втрачений тим, як ми можемо пояснити це припущення в змішаній моделі. Чи слід говорити, що "відхилення постійні в трьох рівнях лікування, що обумовлюють суб'єкти? Чи ні?"ϵ  N(0,σ2Я)

  1. Інтернет-документ SAS про залишки та діагностику впливу створив дві різні залишки, тобто граничні залишки , та залишки , Моє запитання: для чого використовуються два залишки? Як ми могли використовувати їх для перевірки припущення про однорідність? Для мене для вирішення питання однорідності можна використовувати лише граничні залишки, оскільки це відповідає моделі. Чи моє розуміння тут правильне? г з = У - Х β - Z γ = г м - Z γ . ϵ

    rм=Y-Хβ^
    rc=Y-Хβ^-Zγ^=rм-Zγ^.
    ϵ
  2. Чи пропонуються якісь тести для тестування припущення гомогенності за лінійною змішаною моделлю? @Kam вказував тест levene раніше, це буде правильний шлях? Якщо ні, то які напрямки? Я думаю, що після того, як ми підійдемо до змішаної моделі, ми можемо отримати залишки, і, можливо, зможемо зробити деякі тести (як тест на придатність?), Але не впевнений, як це буде.

  3. Я також зауважив, що є три типи залишків від Proc Mixed у SAS, а саме: сирий залишок , залишок Studentized та залишок Пірсона . Я можу зрозуміти відмінності між ними з точки зору формул. Але мені здається, вони дуже схожі, коли мова йде про реальні графіки даних. То як же їх використовувати на практиці? Чи бувають ситуації, коли одному типу віддають перевагу іншим?

  4. Для реального прикладу даних наступні два залишкових ділянки - від Proc Mixed в SAS. Як би можна було вирішити припущення про однорідність дисперсій?

[Я знаю, що у мене тут є кілька питань. Якщо ви могли б дати мені будь-яку вашу думку з будь-якого питання, це чудово. Якщо не можете, звертайтеся до всіх. Я дуже хочу обговорити їх, щоб отримати повне розуміння. Дякую!]

Ось граничні (сирі) залишкові ділянки. Ось граничні (сирі) залишкові ділянки.

Ось умовні (сирі) залишкові ділянки. Ось умовні (сирі) залишкові ділянки.


Великі питання - можлива відповідь на ваш номер 2 можна знайти тут comp.soft-sys.sas.narkive.com/7Qmrgufe / ...
Dandar

Відповіді:


3

Я думаю, що питання 1 і 2 взаємопов'язані. Спочатку припущення про однорідність варіації походить звідси . Але це припущення можна послабити до більш загальних дисперсійних структур, в яких припущення про однорідність не є необхідним. Це означає, що це дійсно залежить від того, як передбачається розподіл .ϵ  N(0,σ2Я)ϵ

По-друге, умовні залишки використовуються для перевірки розподілу (таким чином, будь-яких припущень, пов'язаних з) , тоді як граничні залишки можуть бути використані для перевірки загальної структури дисперсії.ϵ


Я стикаюся з деякими тими ж проблемами, що і @AaronZeng. Що означає "перевірити загальну структуру дисперсії", для якої слід використовувати граничні залишки? Як можна було б це зробити, і чому б просто не зосередитись на тому, щоб перевірити структуру дисперсії на ? Дякую. γ
кларпаул

1

Це дійсно широка тема, і я дам лише загальну картину про підключення до стандартної лінійної регресії.

У моделі, наведеній у запитанні, якщо , де позначає тему або кластер. Нехай . Використовуючи розклад Чолеського , ми можемо перетворити матрицю результатів і проектування,

yiN(Xiβ,ZiDZi+σ2I),
γiN(0,D)iΣi=ZiDZi'+σ2ЯΣi=LiLi'
уi=Li-1уi;Хi=Li-1Хi.

Як зазначається у прикладному поздовжньому аналізі (Сторінка 268), узагальнену оцінку найменших квадратів (GLS) (регресування на ) можна переоцінити з регресії OLS на . Отже, тут можна використовувати всю вбудовану залишкову діагностику з отриманого OLS .y i X i y i X iβуiХiуiХi

Що нам потрібно зробити:

  1. оцінка з оцінки (граничної) залишкової або дисперсійної складової в лінійній змішаній моделі;Σi
  2. перевстановити регресію OLS за допомогою перетворених даних.

Регрес OLS передбачає незалежні спостереження з однорідною дисперсією, тому до його залишків можна застосовувати стандартні методи діагностики.

Набагато детальніше можна ознайомитись у главі 10 "Залишкові аналізи та діагностика" книги " Прикладний поздовжній аналіз" . Вони також обговорювали трансформацію залишків за допомогою , і є деякі ділянки (трансформованих) залишків (проти прогнозованих значень або прогнокторів). Більше читань перелічено в 10.8 "Подальші читання" та Бібліографічні примітки до них.Li

Крім того, на мою думку, враховуючи, що є незалежними з однорідною дисперсією, ми можемо перевірити ці припущення на умовних залишках, використовуючи інструменти стандартної регресії.ϵ


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.