Підводні камені лінійних змішаних моделей

18

Які основні підводні камені використання лінійних моделей зі змішаними ефектами? Які найважливіші речі, на які слід перевірити / слідкувати, оцінюючи відповідність вашої моделі? Порівнюючи моделі одного і того ж набору даних, які найважливіші речі потрібно шукати?

mixed-model model-comparison

— Алан Х.
джерело

16

Це гарне запитання.

Ось кілька загальних підводних каменів:

Використовуючи стандартну теорію ймовірності, ми можемо отримати тест для порівняння двох вкладених гіпотез, і , обчисливши статистику тесту коефіцієнта ймовірності. Нульовий розподіл цієї тестової статистики приблизно чі-квадрат зі ступенями свободи, рівними різниці розмірів проміжків двох параметрів. На жаль, цей тест є лише приблизним і вимагає декількох припущень. Одне вирішальне припущення полягає в тому, що параметри під нулем не знаходяться на межі простору параметрів. Оскільки нас часто цікавлять тестування гіпотез щодо випадкових ефектів, які мають форму: Це справжнє занепокоєння. $H_0$ $H_1$
$Н_{0} : σ^{2} = 0$ $H_0: \sigma^2=0$ Шлях подолання цієї проблеми - це використання REML. Але все-таки p-значення, як правило, будуть більшими, ніж повинні бути. Це означає, що якщо ви спостерігаєте значний ефект, використовуючи наближення χ2, ви можете бути досить впевнені, що він насправді значущий. Невеликі, але не суттєві значення р можуть підштовхнути використання більш точних, але трудомістких методів завантаження.
Порівняння фіксованих ефектів: Якщо ви плануєте використовувати тест коефіцієнта ймовірності для порівняння двох вкладених моделей, які відрізняються лише своїми фіксованими ефектами, ви не можете використовувати метод оцінки REML. Причина полягає в тому, що REML оцінює випадкові ефекти, розглядаючи лінійні комбінації даних, які видаляють фіксовані ефекти. Якщо ці фіксовані ефекти будуть змінені, ймовірність двох моделей не буде прямо порівнянною.
P-значення: Р-значення, отримані за допомогою тесту на коефіцієнт ймовірності для фіксованих ефектів, є приблизними та, на жаль, як правило, занадто малі, тим самим іноді завищуючи важливість деяких ефектів. Ми можемо використовувати непараметричні методи завантаження для пошуку більш точних p-значень для тесту на коефіцієнт ймовірності.
Існують і інші занепокоєння щодо p-значень для тесту на фіксовані ефекти, які підкреслив доктор Дуг Бейтс [ тут ].

Я впевнений, що інші члени форуму матимуть кращі відповіді.

Джерело: Розширення лінійних моделей за допомогою доктора Джулайна Фаравея.

— suncoolsu
джерело

9

Спільна помилка, яку я бачу, - це ігнорування дисперсії випадкових ефектів. Якщо вона велика порівняно із залишковою дисперсією або дисперсією залежної змінної, підхід зазвичай виглядає добре, але лише тому, що випадкові ефекти враховують всю дисперсію. Але оскільки графік фактичного та прогнозованого виглядає добре, ви схильні думати, що ваша модель хороша.

Все розпадається, коли така модель використовується для прогнозування нових даних. Зазвичай тоді можна використовувати лише фіксовані ефекти, і придатність може бути дуже поганою.

— mpiktas
джерело

6

Моделювання дисперсійної структури, мабуть, є найпотужнішою та найважливішою особливістю змішаних моделей. Це виходить за межі дисперсійної структури і включає кореляцію між спостереженнями. Необхідно бути обережним для побудови відповідної структури коваріації, інакше тести гіпотез, довірчі інтервали та оцінки засобів лікування можуть бути неправдивими. Часто потрібні знання експерименту, щоб визначити правильні випадкові ефекти.

SAS для змішаних моделей - це мій перехід на ресурс, навіть якщо я хочу зробити аналіз у Р.

— Глен
джерело