Коли хтось каже, що залишкове відхилення / df повинно бути ~ 1 для моделі Пуассона, наскільки приблизним є приблизний?


16

Я часто бачив поради щодо перевірки того, чи підходить модель Пуассона надмірно розсіяною, що включає ділення залишкового відхилення на ступінь свободи. Отримане співвідношення має бути «приблизно 1».

Питання полягає в тому, про який діапазон ми говоримо для "приблизного" - що таке співвідношення, яке повинно запускати тривогу для розгляду альтернативних форм моделі?


2
Це не відповідь на це цікаве запитання, але те, що я часто буду робити, - це запустити кілька моделей (наприклад, Пуасссон, NB, можливо, з нульовими версіями) та порівняти їх - і щодо заходів типу AIC, і для прогнозованих значень.
Пітер Флом - Відновити Моніку

Це посилання може зацікавити. Спеціально розділ "Критерії оцінки якості придатності".

@Procrastinator Посилання є прекрасним прикладом того, про що я говорю: "Тоді, якщо наша модель добре відповідає даним, відношення відхилення до DF, значення / DF повинно бути приблизно один. Великі значення співвідношення можуть вказувати на модель неправильна специфікація або змінна відповіді за надмірною дисперсією; коефіцієнти, менші за одне, також можуть вказувати на неправильну специфікацію моделі або про змінну відповідь на низьку дисперсію ". Який діапазон "близько 1"? 0,99 до 1,01? 0,75 до 2?
Фоміт

r-bloggers.com/… також має деяку інформацію про те, як відповісти на це питання, хоча відповідь @ StasK досить добре висвітлює це питання.
летить

Відповіді:


14

10 великий ... 1,01 - ні. Оскільки дисперсія χk2 дорівнює 2k (див. Вікіпедія ), стандартне відхилення χk2 дорівнює 2k , аχk2/k-2/k . Ось ваша мірна палиця: дляχ1002 , 1,01 не велика, але 2 велика (за 7 сдс). Дляχ10,0002 , 1,01 це нормально, але 1,1 - ні (7 сдс).


1
"тому має стандартне відхилення χk2/k2/k

amazon.com / ... . Вибачте, що я мудак, але це розподіл посилань на статистичні умовиводи; якщо ви цього не розумієте, вам не слід працювати з узагальненими лінійними моделями, такими як Пуассон.
StasK

2
Для подальшої довідки ви можете замість префікса / вибачення щодо того, що це мудак, просто вказати інформацію та посилання. Це, ймовірно, врятує вас, набравши текст, і змусить вас здаватися менш мудаком, що може бути новим досвідом.
baxx

Див. Редагування та посилання на wikipedia. Я за декілька років зголосився до декількох сотень відповідей, тож я визнаю, що мені дуже складно мати справді новий досвід.
Стаск

7

Асимптотично відхилення повинно бути чі-квадратним, розподіленим із середнім рівнем ступенів свободи. Тож розділіть його на ступінь свободи, і ви повинні отримати близько 1, якщо дані не будуть перерозподілені. Щоб отримати правильний тест, просто знайдіть відхилення в таблицях чі-квадратів, але зауважте, що (a), що розподіл квадрата чі - це наближення & (b), що високе значення може вказувати на інші види нестачі (тобто, можливо, чому "близько 1" вважається досить хорошим для роботи уряду).

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.