Тестуйте модель GLM, використовуючи нульові та модельні відхилення


11

Я створив модель glm в R і протестував її за допомогою групи для тестування та навчання, тому впевнений, що вона працює добре. Результати R:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Усі значення p для коефіцієнтів невеликі, як очікувалося.

Дивлячись на це запитання ( Інтерпретація залишкового та нульового відхилення в GLM R ), я повинен мати можливість обчислити, чи має місце нульова гіпотеза, використовуючи таке рівняння:

p-value = 1 - pchisq(deviance, degrees of freedom)

Додавання цього в дає:

1 - pchisq(256600, 671266)
[1] 1

Отже, я правильно вважаю, що нульову гіпотезу тут не можна відкинути, навіть якщо значення p для всіх коефіцієнтів настільки малі або я неправильно трактував, як це обчислити?

Відповіді:


18

Тут є непорозуміння. Різниця між нулем девіантності і девіантності в моделі поширюється як хі-квадрат зі ступенями свободи дорівнює нульовому ФР мінус ФР моделі. Для вашої моделі це було б:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

За замовчуванням pchisq()дає частку розподілу зліва від значення. Щоб отримати пропорцію більш екстремальну, ніж ваша різниця, ви можете вказати lower.tail = FALSEабо відняти результат від (як ви і я зробили). 1


2
Яку гіпотезу ви точно тестуєте із твердженням 1-pchisq(256600 - 237230, df=(671266 - 671263))?
jII

5
@jesterII, ви перевіряєте, чи змінився відхилення більше, ніж можна було очікувати випадково. Тобто ви тестуєте, чи модель в цілому краща за нульову модель. Це аналогічно глобальному випробуванню F у лінійній моделі.
gung - Відновіть Моніку

Нульова гіпотеза - «модель в цілому краща за нульову модель», і ви відкинули нульову гіпотезу, а це означає, що модель погана?
jII

3
@jesterII, жодна нульова гіпотеза така: «модель в цілому не краща за нульову модель». Оскільки це було відхилено, ми робимо висновок, що дані не відповідають нульовій моделі. Зверніть увагу: це не обов'язково означає, що наша модель "хороша" чи "правильна".
gung - Відновити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.