Перш ніж задавати це питання, я здійснив пошук на нашому сайті і знайшов багато подібних питань (наприклад, тут , тут і тут ). Але я вважаю, що на ці пов’язані питання недостатньо відповіли чи обговорили, тому я хотів би знову поставити це питання. Я вважаю, що має бути велика кількість аудиторії, яка бажає, щоб подібні питання були пояснені більш чітко.
Для моїх питань спочатку розглянемо лінійну модель змішаних ефектів,
Припустимо, єдиним фактором з фіксованою дією є категорична змінна Лікування , що має 3 різних рівня. І єдиним фактором випадкових ефектів є змінна Subject . Однак, у нас є змішана модель із фіксованим ефектом лікування та випадковим суб'єктом.
Мої запитання, таким чином:
- Чи існує однорідність припущення дисперсії в лінійній змішаній моделі, аналогічна традиційним моделям лінійної регресії? Якщо так, що конкретно означає припущення у контексті задачі лінійної змішаної моделі, зазначеної вище? Які ще важливі припущення, які потрібно оцінити?
Мої думки: ТАК. припущення (я маю на увазі нульову середню помилку та рівну дисперсію) все ще звідси: . У традиційній лінійній регресійній моделі можна сказати, що припущення полягає в тому, що "дисперсія помилок (або просто дисперсія залежної змінної) є постійною на всіх 3 рівнях лікування". Але я втрачений тим, як ми можемо пояснити це припущення в змішаній моделі. Чи слід говорити, що "відхилення постійні в трьох рівнях лікування, що обумовлюють суб'єкти? Чи ні?"
Інтернет-документ SAS про залишки та діагностику впливу створив дві різні залишки, тобто граничні залишки , та залишки , Моє запитання: для чого використовуються два залишки? Як ми могли використовувати їх для перевірки припущення про однорідність? Для мене для вирішення питання однорідності можна використовувати лише граничні залишки, оскільки це відповідає моделі. Чи моє розуміння тут правильне? г з = У - Х β - Z γ = г м - Z γ . ϵ
Чи пропонуються якісь тести для тестування припущення гомогенності за лінійною змішаною моделлю? @Kam вказував тест levene раніше, це буде правильний шлях? Якщо ні, то які напрямки? Я думаю, що після того, як ми підійдемо до змішаної моделі, ми можемо отримати залишки, і, можливо, зможемо зробити деякі тести (як тест на придатність?), Але не впевнений, як це буде.
Я також зауважив, що є три типи залишків від Proc Mixed у SAS, а саме: сирий залишок , залишок Studentized та залишок Пірсона . Я можу зрозуміти відмінності між ними з точки зору формул. Але мені здається, вони дуже схожі, коли мова йде про реальні графіки даних. То як же їх використовувати на практиці? Чи бувають ситуації, коли одному типу віддають перевагу іншим?
Для реального прикладу даних наступні два залишкових ділянки - від Proc Mixed в SAS. Як би можна було вирішити припущення про однорідність дисперсій?
[Я знаю, що у мене тут є кілька питань. Якщо ви могли б дати мені будь-яку вашу думку з будь-якого питання, це чудово. Якщо не можете, звертайтеся до всіх. Я дуже хочу обговорити їх, щоб отримати повне розуміння. Дякую!]
Ось граничні (сирі) залишкові ділянки.
Ось умовні (сирі) залишкові ділянки.