Я працюю над тим, щоб відповісти на моє запитання, розраховуючи вручну коефіцієнт шансів і шансів:
Acceptance blue red Grand Total
0 158 102 260
1 112 177 289
Total 270 279 549
Тож коефіцієнт шансів потрапити в школу Червоного над Синім:
O d d s A c c e p t I f Р е дO d d s A c c c e p t I f Б л у е=177/102112/158= 1,73530,7089= 2.448
І це Backgroundred
повернення:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))
Odds_and_OR 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
У той же час (Intercept)
відповідає чисельнику коефіцієнта шансів , який саме є шансом на те, щоб бути "синім" сімейним фоном:112 / 158 = 0,7089.
Якщо замість цього, я запускаю:
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))
Odds 2.5 % 97.5 %
Backgroundblue 0.7088608 0.5553459 0.9017961
Backgroundred 1.7352941 1.3632702 2.2206569
Повернення - це саме шанс отримати «синій»: Backgroundblue
(0.7089), а шанси прийняти «червоний»: Backgroundred
(1.7353). Немає Odds Ratio там. Тому не очікується, що ці два повернені значення будуть взаємними.
Нарешті, як прочитати результати, якщо у категоричному регресорі є 3 фактори?
Те саме ручне обчислення проти [R]:
Я створив інший фіктивний набір даних із тією ж передумовою, але цього разу було три етнічні походження: "червоний", "синій" та "помаранчевий", і вони виконували однакову послідовність:
По-перше, таблиця надзвичайних ситуацій:
Acceptance blue orange red Total
0 86 65 130 281
1 64 42 162 268
Total 150 107 292 549
І підраховано шанси на вступ для кожної етнічної групи:
- Коефіцієнти приймаються, якщо червоний = 1.246154;
- Коефіцієнти приймаються, якщо синій = 0,744186;
- Коефіцієнти приймаються, якщо помаранчевий = 0,646154
Як і різні коефіцієнти шансів :
- АБО червоний v синій = 1,674519;
- АБО червоний v помаранчевий = 1.928571;
- АБО синій v червоний = 0,597186;
- АБО синій v помаранчевий = 1,151717;
- АБО помаранчевий v червоний = 0,518519; і
- АБО помаранчевий v синій = 0,868269
І виходив із тепер рутинної логістичної регресії з наступною експоненцією коефіцієнтів:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))
ODDS 2.5 % 97.5 %
(Intercept) 0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred 1.6745192 1.1271430 2.497853
Поступившись шансами на отримання "блюзу" як (Intercept)
, і коефіцієнти коефіцієнта помаранчевого проти синього Backgroundorange
, а АБО червоного проти синього Backgroundred
.
З іншого боку, регресія без перехоплення передбачувано повернула лише три незалежні шанси :
fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))
ODDS 2.5 % 97.5 %
Backgroundblue 0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred 1.2461538 0.9900426 1.5715814
R
явно викликає коефіцієнти (через функціюcoef
), ви називаєте " коефіцієнт шансів" у своєму виході. Це говорить про те, що ви можете переглянути розбіжність між ними.