Тест на співвідношення ймовірності та тест Вальда дають різний висновок щодо glm в R

Я відтворюю приклад із узагальнених, лінійних та змішаних моделей . Мій MWE нижче:

Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4)
NoofPlates <- rep(x=5, times=10)
NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5)
Data <- data.frame(Dilution,  NoofPlates, NoPositive)

fm1 <- glm(formula=NoPositive/NoofPlates~log(Dilution), family=binomial("logit"), data=Data)
summary(object=fm1)

Вихідні дані

Call:
glm(formula = NoPositive/NoofPlates ~ log(Dilution), family = binomial("logit"), 
    data = Data)

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-0.38326  -0.20019   0.00871   0.15607   0.48505  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)      4.174      2.800   1.491    0.136
log(Dilution)    1.623      1.022   1.587    0.112

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 8.24241  on 9  degrees of freedom
Residual deviance: 0.64658  on 8  degrees of freedom
AIC: 6.8563

Number of Fisher Scoring iterations: 6

Код

anova(object=fm1, test="Chisq")

Вихідні дані

Analysis of Deviance Table

Model: binomial, link: logit

Response: NoPositive/NoofPlates

Terms added sequentially (first to last)


              Df Deviance Resid. Df Resid. Dev Pr(>Chi)   
NULL                              9     8.2424            
log(Dilution)  1   7.5958         8     0.6466  0.00585 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Код

library(aod)
wald.test(b=coef(object=fm1), Sigma=vcov(object=fm1), Terms=2)

Вихідні дані

Wald test:
----------

Chi-squared test:
X2 = 2.5, df = 1, P(> X2) = 0.11

Розрахункові коефіцієнти повністю збігаються з результатами, наведеними в книзі, але середні показники економічної діяльності далеко одна від одної. На основі тесту на LRT нахил є значним, але на основі коефіцієнта нахилу Уолда та Z-випробування незначний. Цікаво, чи пропускаю щось базове. Заздалегідь дякую за вашу допомогу.

— MYaseen208
джерело

Пов’язано: Чому мої р-значення відрізняються між результатами логістичної регресії, тестом чи-квадрата та інтервалом довіри для АБО?

— gung - Відновіть Моніку

Основна проблема полягає в тому, що якщо ви збираєтесь використовувати коефіцієнт як змінну відповіді, вам слід використовувати weightsаргумент. Ви, мабуть, проігнорували попередження про "нецілі # # успіхи у двочленному glm" ...

Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4)
NoofPlates <- rep(x=5, times=10)
NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5)
Data <- data.frame(Dilution,  NoofPlates, NoPositive)


fm1 <- glm(formula=NoPositive/NoofPlates~log(Dilution),
     family=binomial("logit"), data=Data, weights=NoofPlates)

coef(summary(fm1))
##               Estimate Std. Error  z value     Pr(>|z|)
## (Intercept)   4.173698  1.2522190 3.333042 0.0008590205
## log(Dilution) 1.622552  0.4571016 3.549653 0.0003857398

anova(fm1,test="Chisq")
##               Df Deviance Resid. Df Resid. Dev  Pr(>Chi)    
## NULL                              9     41.212              
## log(Dilution)  1   37.979         8      3.233 7.151e-10 ***

Результати тестів LRT і Wald все ще досить різні ( -значення проти ), але для практичних цілей ми можемо продовжувати говорити, що вони обидва сильно значущий ... (У цьому випадку (з одним параметром) дає точно таке ж р-значення, як і .) $p$ $4 \times 10^{-4}$ $7 \times 10^{-10}$ aod::wald.test()summary()

Інтервали довіри між Вальдом і профілем також помірно відрізняються, але чи КІ [показано нижче] (0,7,2,5) (Вальд) та (0,9, 2,75) (LRT) практично відрізняються, залежить від конкретної ситуації.

Wald:

confint.default(fm1)
##                   2.5 %   97.5 %
## (Intercept)   1.7193940 6.628002
## log(Dilution) 0.7266493 2.518455

Профіль:

confint(fm1)
##                   2.5 %   97.5 %
## (Intercept)   2.2009398 7.267565
## log(Dilution) 0.9014053 2.757092

— Бен Болкер
джерело