Я хотів би перевірити, яка регресія найкраще відповідає моїм даним. Моя залежна змінна - кількість, і вона має багато нулів.
І мені знадобиться допомога, щоб визначити, яку модель та сімейство використовувати (пуассон чи квазипоассон, або нульову завищену регресію пуассону) та як перевірити припущення.
- Регресія Пуассона: наскільки я розумію, сильне припущення полягає в тому, що залежна змінна середня величина = дисперсія. Як ви це тестуєте? Наскільки близькими вони повинні бути? Чи використовуються для цього безумовне або умовне середнє значення та дисперсія? Що робити, якщо це припущення не дотримується?
- Я читав, що якщо дисперсія більша за середню, у нас є наддисперсія, і потенційний спосіб вирішити це, включаючи більше незалежних змінних або family = quasipoisson. Чи має цей розподіл якісь інші вимоги чи припущення? Який тест я використовую, щоб побачити, чи краще (1) чи (2) підходить просто
anova(m1,m2)
? - Я також читав, що негативно-біноміальний розподіл можна використовувати при появі наддисперсії. Як це зробити в R? Чим відрізняється квазіпоассон?
Нуль-завищена регресія Пуассона: я читав, що за допомогою тесту vuong перевіряється, які моделі краще підходять.
> vuong (model.poisson, model.zero.poisson)
Це правильно? Які припущення мають нульову регресію?
Служба статистичних консультацій UCLA, Статистична консультаційна група має розділ про завищені нульовими пуассоновими регресіями і перевіряє нульову завиту модель (а) на стандартну модель пуассона (b):
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
Я не розумію, що стосується | persons
першої моделі, і чому ви можете порівнювати ці моделі. Я очікував, що регрес буде однаковим і просто використовувати іншу родину.