Я створив логістичну регресію, де змінна результат вилікується після лікування ( Cure
проти No Cure
). Усі пацієнти цього дослідження отримували лікування. Мене цікавить, чи пов’язаний діабет із цим результатом.
У R мій результат логістичної регресії виглядає так:
Call:
glm(formula = Cure ~ Diabetes, family = binomial(link = "logit"), data = All_patients)
...
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.2735 0.1306 9.749 <2e-16 ***
Diabetes -0.5597 0.2813 -1.990 0.0466 *
...
Null deviance: 456.55 on 415 degrees of freedom
Residual deviance: 452.75 on 414 degrees of freedom
(2 observations deleted due to missingness)
AIC: 456.75
Однак довірчий інтервал для коефіцієнта шансів включає 1 :
OR 2.5 % 97.5 %
(Intercept) 3.5733333 2.7822031 4.646366
Diabetes 0.5713619 0.3316513 1.003167
Коли я роблю тест-чи-квадрат на цих даних, я отримую наступне:
data: check
X-squared = 3.4397, df = 1, p-value = 0.06365
Якщо ви хочете обчислити його самостійно, розподіл діабету в групах, що виліковуються і не отверждены, є таким:
Diabetic cure rate: 49 / 73 (67%)
Non-diabetic cure rate: 268 / 343 (78%)
Моє запитання: Чому p-значення та довірчий інтервал, включаючи 1, не погоджуються?
confint()
. Тобто ймовірність була профільована. Таким чином ви отримуєте CI, аналогічні LRT. Ваш розрахунок правильний, але замість цього складайте вальд-інтерфейси. Більше інформації у моїй відповіді нижче.