Завищена дисперсія та знижена дисперсія в негативній біноміальній / пуассоновій регресії


11

Я виконував регресію Пуассона в SAS і виявив, що значення квадрату Пірсона, розділене на ступінь свободи, було приблизно 5, що вказує на значне перевищення рівня. Отже, я підходив до негативної біноміальної моделі з процесом genmodmod і виявив, що значення квадрату Пірсона, поділене на ступінь свободи, становить 0,80. Чи вважається це зараз недозволеним? Якщо так, то як можна займатися цим? Я багато читав про перевищення дисперсії і вважаю, що знаю, як впоратися з цим, але інформація про те, як впоратися або визначити, чи є недостатність, мізерна. Хтось може допомогти?

Дякую.


Відповіді:


17

Для розподілу Пуассона із середнім дисперсія також μ . У рамках узагальнених лінійних моделей це означає, що дисперсійною функцією є V ( μмкмк

V(мк)=мк

V(мк)=ψмк
ψ>0p

V(мк)=амк2+бмк+c,
λ>0
V(мк)=мк(1+мкλ).
λ

λ=λ<Регресійні тести на наддисперсію в моделі Пуассона досліджують клас тестів на загальні дисперсійні функції.

Однак я б рекомендував насамперед вивчити залишкові ділянки, наприклад, графік залишків Пірсона або відхилення (або їх значення у квадраті) проти встановлених значень. Якщо функціональна форма дисперсії неправильна, ви побачите це як форма воронки (або тенденція для залишків у квадраті) у залишковому графіку. Якщо функціональна форма правильна, тобто немає воронки чи тренду, все одно може бути надмірна або недогіперсійна, але це можна пояснити, оцінюючи параметр дисперсії. Перевага залишкового сюжету полягає в тому, що він чітко підказує, ніж тест, що не так з функцією дисперсії, якщо щось є.

У конкретному випадку ОП неможливо сказати, якщо 0,8 вказує на недооцінку від даної інформації. Замість того, щоб зосередитись на оцінках 5 та 0,8, я пропоную перш за все дослідити відповідність дисперсійних функцій моделі Пуассона та негативної біноміальної моделі. Після того, як визначена найбільш відповідна функціональна форма дисперсійної функції, параметр дисперсії може бути включений, якщо це необхідно, в будь-яку модель для коригування статистичного умовиводу для будь-якого додаткового надмірного чи недооцінки. Скажімо, як це легко зробити в SAS, на жаль, я не можу допомогти.


2
+1, це гарна загальна інформація. Це може бути кориснішим для ОП, якщо ви спеціально вирішили чіткі запитання ОП: (1) є .8 недооціненим; & (2) якщо так, то як поводитися з тим.
gung - Відновіть Моніку

@gung, я відредагував відповідь, щоб дати більш конкретні поради. Ви не можете визначити, чи 0,8 значно менший за 1 з наявної інформації, і IMHO, орієнтуючись на те, чи є параметр дисперсії 1, є диверсією. Моя редакція пояснює, на що я думаю, що на цьому слід зосередити увагу ОП.
NRH
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.