Дозволено порівняння моделей змішаних ефектів (насамперед випадкових ефектів)


20

Я розглядав моделювання змішаних ефектів за допомогою пакету lme4 в Р. Я в основному використовую lmerкоманду, тому я буду ставити своє запитання через код, який використовує цей синтаксис. Я думаю, що може бути загальним простим питанням: чи добре порівнювати будь-які дві моделі, побудовані з lmerвикористанням коефіцієнтів ймовірності на основі однакових наборів даних? Я вважаю, що відповідь на це повинна бути "ні", але я можу бути неправильною. Я читав суперечливу інформацію про те, чи повинні випадкові ефекти бути однаковими чи ні, і який компонент випадкових ефектів мається на увазі під цим? Отже, я наведу кілька прикладів. Я візьму їх із даних повторних заходів, використовуючи слово стимули, можливо, щось на зразок Baayen (2008) було б корисно для інтерпретації.

Скажімо, у мене є модель, у якій є два передбачувачі фіксованих ефектів, ми їх назвемо A і B, а також деякі випадкові ефекти ... слова та предмети, які їх сприймали. Я можу побудувати таку модель, як наступна.

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(зауважте, що я навмисно вийшов з ладу, data =і будемо вважати, що завжди маю REML = FALSEна увазі заради ясності)

Тепер, з наступних моделей, які в порядку, щоб порівняти з коефіцієнтом ймовірності до вищезгаданих, а які ні?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

Я визнаю, що тлумачення деяких цих відмінностей може бути важким або неможливим. Але давайте відкладемо це на секунду. Я просто хочу знати, чи є щось основне в змінах тут, що виключає можливість порівняння. Я також хочу знати, чи є в порядку LR, і порівняння AIC.



(Я помітив, що ви видалили тег [тестування гіпотез], який я додав раніше. Ну, вам належить, але я вважаю, що це доречно: тест на коефіцієнт ймовірності явно є процедурою тестування гіпотез, і [змішана модель] + [тестування гіпотез ] - це ІМХО інформативна комбінація тегів, див. stats.stackexchange.com/questions/tagged/… )
амеба каже, що повернеться Моніка

Відредаговано, щоб видалити "тест" з LR. LR можна інтерпретувати без тесту, і це робить його більш паралельним АІК і краще відповідає моєму реальному наміру. Дякуємо, що вказали на це.
Джон

Відповіді:


13

Використовуючи максимальну ймовірність, будь-яке з них можна порівняти з AIC; якщо фіксовані ефекти однакові ( m1до m4), використання REML або ML є нормальним, зазвичай REML є кращим, але якщо вони різні, можна використовувати тільки ML. Однак інтерпретація зазвичай є складною, коли змінюються як фіксовані ефекти, так і випадкові ефекти, тому на практиці більшість рекомендують змінювати лише той чи інший за один раз.

Використання тесту на коефіцієнт ймовірності можливо, але безладно, оскільки звичайне наближення чи-квадрата не дотримується при тестуванні, якщо компонент дисперсії дорівнює нулю. Детальніше дивіться у відповіді Аніко. (Кудо Аніко за те, що читав питання уважніше, ніж я, і читав мою оригінальну відповідь досить уважно, щоб помітити, що вона пропустила цю точку. Дякую!)

Піньєро / Бейтс - класична довідка; він описує nlmeпакет, але теорія та ж. Ну, переважно те саме; Дуг Бейтс змінив свої рекомендації щодо висновку з часу написання цієї книги та нових рекомендацій, відображених у lme4пакеті. Але це більше, ніж я хочу потрапити сюди. Більш читаною посиланням є Weiss (2005), "Моделювання поздовжніх даних".


моделі m2 і m4 або m1 і m3 не можна порівняти з тестом на коефіцієнт ймовірності. Вони не є вкладеними моделями.
Макрос

Ой, спасибі, що це зробив, @Macro! Див. Редагування.
Аарон - Відновити Моніку

Питання полягало лише в порівнянні моделей з моделлю m, а не між собою. Але ви все-таки говорите, що порівняння AIC можна проводити навіть тоді, коли вони не вкладені? Відповіді на це питання, здається, суперечать цьому.
Джон

@John, я прочитав ці відповіді, але пропустив, де в ньому обговорюється AIC та не вкладений. Я впевнений, що це добре, але чи можете ви дати мені більш точний вказівник на цей момент у відповідях?
Аарон - Відновити Моніку

Я спростував відповідь, оскільки ви помиляєтесь (або принаймні вводите в оману) щодо застосованості тесту на коефіцієнт ймовірності.
Аніко

12

mmm4σ2=0

mm212χ12+12χ02χ12

Однак, як заявив @Aaron, багато експертів не рекомендують робити такий тест на коефіцієнт ймовірності. Потенційними альтернативами є інформаційні критерії (AIC, BIC тощо) або завантаження LRT.

[1] Self, SG & Liang, K. Асимптотичні властивості оцінювачів максимальної ймовірності та тестування коефіцієнта ймовірності в нестандартних умовах Дж. Амер. Статист. Доц., 1987, 82, 605-610.


1
Дякуємо за інформацію про LR Я не дуже думав над проблемою межі LR, коли робив моделі для прикладу. Щойно я помітив, що у вашій відповіді незрозуміло, чи ваші рекомендації стосуються простих випадків, таких як просто порівняння моделей з різними фіксованими ефектами (оцінюється, звичайно, ML).
Джон

Ні, ця проблема виникає лише при тестуванні компонентів дисперсії, а не фіксованих ефектів.
Аарон - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.