Порівняння регресійних моделей за даними підрахунку


11

Нещодавно я підходив до чотирьох моделей регресії для одних і тих же даних прогноктора / відповіді. Дві моделі, які мені підходять з регресією Пуассона.

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

Дві моделі, що підходять мені, мають негативну біноміальну регресію.

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

Чи є статистичний тест, який я можу використовувати для порівняння цих моделей? Я використовував AIC як міру придатності, але AFAIK це не є фактичним тестом.


Ви хочете , щоб порівняти моделі підгонку використовуючи статистичний тест, НЕ так? Яку гіпотезу ви хотіли б перевірити?
Firefeather

@Firefeather Наприклад, я хотів би перевірити , є чи підгонка model.nb.interце значно краще , ніж у model.pois.inter. Так, АПК нижча, але наскільки нижча є значно кращою ?
Даніель Стенджаж

Примітка: відповідь на це питання насправді не повинна включати АПК.
Даніель Стенджаж

Жmodel.poismodel.pois.intermodel.nbmodel.nb.interЖ

1
@Firefeather, так, я знаю, що потрібно контролювати рівень довіри в родині. Чи підходив би тут Шеффе більше, ніж, скажімо, Бонферроні?
Даніель Стенджаж

Відповіді:


14

Можна порівняти негативну біноміальну модель з відповідною моделлю Пуассона з тестом на коефіцієнт ймовірності. Модель Пуассона еквівалентна негативній біноміальній моделі з параметром передисперсії нуля. Тому вони є вкладеними моделями і коефіцієнти ймовірності є дійсними. Ускладнення полягає в тому, що параметр передисперсії обмежений як негативний, тобто логічно він не може бути меншим за нуль, тому нульова гіпотеза знаходиться на межі простору параметрів. Це означає, що замість того, щоб двічі порівнювати ймовірність журналу з розподілом чі-квадрата з одним ступенем свободи, вам потрібно порівнювати його з розподілом суміші, що складається з рівних частин чі-квадрата з 1 df і точкової маси в нулі (розподіл у квадраті з нульовим ступенем свободи). На практиці це означає, що ви можете обчислити значення р, використовуючи чі-квадрат з 1 df, а потім вдвічі зменшити його. Більш детальну інформацію та інформацію див. У справі 5Self & Liang JASA 1987; 82 : 605-610. .

Зауважте, що деякі статистичні програмні пакети, такі як Stata, робитимуть все це автоматично для вас, коли ви підходите до негативної біноміальної моделі. Насправді я безсоромно переказав багато з вищезазначеного з довідкової системи Stata - якщо ви бачите Stata help j_chibar.


5

Я вірю, що anova()R може бути використаний для цього. Незважаючи на свою назву, це тест на вірогідність. Кроулі у своїй книзі «The R» має кілька прикладів використання.


1

Як зазначає onestop, оскільки моделі є вкладеними, ви можете провести тест на коефіцієнт ймовірності.

Загалом, хоча це не відповідає дійсності, тому, якщо ви хочете порівняти вкладені моделі, ви можете скористатися тестом Вуонга .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.