Я хочу виконати логістичну регресію з наступною біноміальною відповіддю та з та як мої прогнози.
Я можу представити ті самі дані, що й відповіді Бернуллі, у наступному форматі.
Виходи логістичної регресії для цих двох наборів даних здебільшого однакові. Залишки відхилення та АПК різні. (Різниця між нульовим відхиленням і залишковим відхиленням однакова в обох випадках - 0,228.)
Далі наведені результати регресії з Р. Набори даних називаються binom.data та bern.data.
Ось біноміальний вихід.
Call:
glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2,
family = binomial, data = binom.data)
Deviance Residuals:
[1] 0 0 0
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2.2846e-01 on 2 degrees of freedom
Residual deviance: -4.9328e-32 on 0 degrees of freedom
AIC: 11.473
Number of Fisher Scoring iterations: 4
Ось вихід Бернуллі.
Call:
glm(formula = Success ~ X1 + X2, family = binomial, data = bern.data)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6651 -1.3537 0.7585 0.9281 1.0108
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 15.276 on 11 degrees of freedom
Residual deviance: 15.048 on 9 degrees of freedom
AIC: 21.048
Number of Fisher Scoring iterations: 4
Мої запитання:
1) Я бачу, що точкові оцінки та стандартні помилки між двома підходами є рівнозначними в цьому конкретному випадку. Чи правда ця еквівалентність взагалі?
2) Як можна відповісти на запитання №1 математично?
3) Чому залишки відхилення та AIC відрізняються?