Враховуючи три змінні, y
і x
які є позитивними безперервними, і z
, що є категоричним, у мене є дві моделі-кандидати, задані:
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
і
fit.fe <- lm( y ~ 1 + x )
Я сподіваюся порівняти ці моделі, щоб визначити, яка модель є більш підходящою. Мені здається, що в якомусь сенсі fit.fe
вкладене всередині fit.me
. Зазвичай, коли цей загальний сценарій виконується, можна провести тест на квадрат чи. В R
, ми можемо виконати цей тест за допомогою наступної команди,
anova(fit.fe,fit.me)
Коли обидві моделі містять випадкові ефекти (генеруються lmer
з lme4
пакета), то anova()
команда працює відмінно. Завдяки граничним параметрам, як правило, доцільно перевірити отриману статистику Chi-Square за допомогою моделювання, проте, ми все ще можемо використовувати статистику в процедурі моделювання.
Коли обидві моделі містять лише фіксовані ефекти, цей підхід --- і, пов'язана anova()
команда --- працюють добре.
Однак, коли одна модель містить випадкові ефекти, а зменшена модель містить лише фіксовані ефекти, як у вищенаведеному сценарії, anova()
команда не працює.
Більш конкретно, я отримую таку помилку:
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
Чи є щось не так у використанні підходу Chi-Square зверху (за допомогою моделювання)? Або це просто проблема anova()
невідомого поводження з лінійними моделями, породженими різними функціями?
Іншими словами, чи було б доцільно вручну генерувати статистику Chi-Square, похідну від моделей? Якщо так, то які відповідні ступені свободи для порівняння цих моделей? За моїм врахуванням:
Ми оцінюємо два параметри в моделі фіксованих ефектів (нахил та перехоплення) та ще два параметри (параметри дисперсії для випадкового нахилу та випадкового перехоплення) у моделі змішаних ефектів. Зазвичай параметр перехоплення не враховується в градусах обчислення свободи, так що випливає, що і ; сказав, що я не впевнений, чи слід включити параметри дисперсії для параметрів випадкових ефектів у ступінь обчислення свободи; Оцінки дисперсії для параметрів фіксованого ефекту не враховуються , але я вважаю, що це відбувається тому, що оцінки параметрів фіксованих ефектів вважаються невідомими постійними, в той час як вони вважаються невизнаними випадковими зміннимиp = k + 2 = 3для змішаних ефектів. Буду вдячний за допомогу в цьому питанні.
Нарешті, чи є у когось більш підходяще ( R
засноване) рішення для порівняння цих моделей?
lm()
зgls()
зnlme
пакета, іlmer()
зlme()
(знову ж зnlme
пакета), то все буде працювати нормально. Але зауважте, що ви отримаєте консервативний тест (занадто великі p -значення), оскільки параметри для більш простої моделі знаходяться на межі простору параметрів. І дійсно вибір того, чи включати випадкові ефекти, повинен базуватися на теорії (наприклад, план вибірки), а не на статистичному тесті.