Порівняння не вкладених моделей з AIC


19

Скажімо, ми маємо GLMM

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Ці моделі не вкладені у звичайному розумінні:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

тож ми не можемо робити так, anova(mod1, mod2)як ми б anova(a ,b).

Чи можемо ми використовувати AIC, щоб сказати, яка натомість найкраща модель?

Відповіді:


24

AIC можна застосовувати з не вкладеними моделями. Насправді це один із найпоширеніших міфів (непорозумінь?) Про АПК. Побачити:

Слід бути обережним - включити всі нормуючі константи, оскільки вони різні для різних (не вкладених) моделей:

Дивись також:

У контексті GLMM більш делікатним є питання про те, наскільки надійний AIC для порівняння подібних моделей (див. Також @ BenBolker's). Інші версії АПК обговорюються та порівнюються у наступній роботі:


2
зауважте, що граничне та умовне розрізнення АПК є найважливішим при спробі порівняння моделей, що відрізняються за набором випадкових ефектів
Бен Болкер,

@Chandelier & Ben Bolker дуже дякую за обидві ваші відповіді. Чи трапляється у когось із вас більш офіційне посилання на аргумент щодо використання AIC таким чином?
користувач1322296

2
@ user1322296 Я б запропонував перейти до кореня, це папір Akaike . AIC отримують як оцінювач розбіжності між вашою моделлю та "справжньою моделлю". Отже, не передбачається гніздування, лише деякі умови регулярності.
Люстра

Тож чи справедливо порівнювати, наприклад, AIC lm1 = x ~ A + B C та lm2 = x ~ D + B C? Спасибі
crazjo

Можливо, є вкладені моделі, для яких використання AIC не підходить. Ось два приклади: 1 і 2 . Надайте, будь ласка, деякі умови, за яких працює невкладений вибір моделі?
Карл

10

Для довідки, контраргумент: Брайан Ріплі зазначає у "Вибір серед великих класів моделей", стор. 6-7

Важливі припущення ... Моделі вкладені (виноска: див. Внизу сторінки 615 у передруку Akaike (1973)). - AIC широко використовується, коли їх немає

Відповідний уривок (також стор. 204 чергового передруку Akaike) починається, я думаю, фразою "Проблема ідентифікації статистичної моделі часто формулюється як проблема відбору f(х|кθ) ... ") не зовсім доступний тут ; я шукаю PDF-документ, щоб тут міг цитувати уривок ...

Ріплі, BD 2004. "Вибір серед великих класів моделей". Методи та моделі статистики , під редакцією Н. Адамса, М. Кроудера, Д. Дж. Хенд і Д. Стівенса, 155–70. Лондон, Англія: Imperial College Press.

Akaike, H. (1973) Теорія інформації та розширення принципу максимальної ймовірності. У другому міжнародному симпозіумі з теорії інформації (Ред. Б. Н. Петров та Ф. Каскі), стор. 267–281, Будапешт. Академія Кайдо. Передруковано у " Проривах статистики" , ред. Kotz, S. & Johnson, NL (1992), том I, стор. 599–624. Нью-Йорк: Спрінгер.


3

Здається, Akaike подумав, що AIC є корисним інструментом для порівняння вкладених моделей.

"Одне важливе спостереження щодо AIC - це те, що воно визначається без конкретного посилання на справжню модель [f (x | kθ)]. Таким чином, для будь-якої кінцевої кількості параметричних моделей ми завжди можемо вважати розширену модель, яка буде грати роль [f (x | kθ)] Це говорить про те, що AIC може бути корисною, принаймні в принципі, для порівняння моделей, які є нестійкими, тобто ситуації, коли звичайний тест коефіцієнта вірогідності журналу не застосовується ".

(Akaike 1985, стор. 399)

Akaike, Hirotugu. "Прогнозування та ентропія." Вибрані статті Hirotugu Akaike. Спрингер, Нью-Йорк, Нью-Йорк, 1985. 387-410.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.