Враховуючи три змінні, yі xякі є позитивними безперервними, і z, що є категоричним, у мене є дві моделі-кандидати, задані:
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
і
fit.fe <- lm( y ~ 1 + x )
Я сподіваюся порівняти ці моделі, щоб визначити, яка модель є більш підходящою. Мені здається, що в якомусь сенсі fit.feвкладене всередині fit.me. Зазвичай, коли цей загальний сценарій виконується, можна провести тест на квадрат чи. В R, ми можемо виконати цей тест за допомогою наступної команди,
anova(fit.fe,fit.me)
Коли обидві моделі містять випадкові ефекти (генеруються lmerз lme4пакета), то anova()команда працює відмінно. Завдяки граничним параметрам, як правило, доцільно перевірити отриману статистику Chi-Square за допомогою моделювання, проте, ми все ще можемо використовувати статистику в процедурі моделювання.
Коли обидві моделі містять лише фіксовані ефекти, цей підхід --- і, пов'язана anova()команда --- працюють добре.
Однак, коли одна модель містить випадкові ефекти, а зменшена модель містить лише фіксовані ефекти, як у вищенаведеному сценарії, anova()команда не працює.
Більш конкретно, я отримую таку помилку:
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
Чи є щось не так у використанні підходу Chi-Square зверху (за допомогою моделювання)? Або це просто проблема anova()невідомого поводження з лінійними моделями, породженими різними функціями?
Іншими словами, чи було б доцільно вручну генерувати статистику Chi-Square, похідну від моделей? Якщо так, то які відповідні ступені свободи для порівняння цих моделей? За моїм врахуванням:
Ми оцінюємо два параметри в моделі фіксованих ефектів (нахил та перехоплення) та ще два параметри (параметри дисперсії для випадкового нахилу та випадкового перехоплення) у моделі змішаних ефектів. Зазвичай параметр перехоплення не враховується в градусах обчислення свободи, так що випливає, що і ; сказав, що я не впевнений, чи слід включити параметри дисперсії для параметрів випадкових ефектів у ступінь обчислення свободи; Оцінки дисперсії для параметрів фіксованого ефекту не враховуються , але я вважаю, що це відбувається тому, що оцінки параметрів фіксованих ефектів вважаються невідомими постійними, в той час як вони вважаються невизнаними випадковими зміннимиp = k + 2 = 3для змішаних ефектів. Буду вдячний за допомогу в цьому питанні.
Нарешті, чи є у когось більш підходяще ( Rзасноване) рішення для порівняння цих моделей?
lm()зgls()зnlmeпакета, іlmer()зlme()(знову ж зnlmeпакета), то все буде працювати нормально. Але зауважте, що ви отримаєте консервативний тест (занадто великі p -значення), оскільки параметри для більш простої моделі знаходяться на межі простору параметрів. І дійсно вибір того, чи включати випадкові ефекти, повинен базуватися на теорії (наприклад, план вибірки), а не на статистичному тесті.