Від досвіду (коефіцієнтів) до коефіцієнта коефіцієнта та їх інтерпретації в логістичній регресії з факторами


14

Я провів лінійну регресію прийому до коледжу на основі балів SAT та сімейного / етнічного походження. Дані вигадані. Це продовження попереднього запитання, вже відповіді. Питання фокусується на збиранні та інтерпретації коефіцієнтів шансів, залишаючи бали SAT осторонь простоти.

Змінні: Accepted(0 або 1) та Background("червоний" чи "синій"). Я налаштував дані, щоб люди з "червоним" фоном частіше потрапляли:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))

                        Odds_Ratio_RedvBlue             2.5 %       97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

Запитання:

  1. Чи приймається 0,7 непарне співвідношення людини "синього" фону? Я запитую це, тому що я також отримую 0,7 для " Backgroundblue", якщо замість цього я запускаю такий код:

    fit <- glm(Accepted~Background-1, data=dat, family="binomial")
    exp(cbind(OR=coef(fit), confint(fit)))
  2. Аccеpтег/Rег:Аccеpтег/БлуеОггсБлуе=1/ОггсRег


1
Що Rявно викликає коефіцієнти (через функцію coef), ви називаєте " коефіцієнт шансів" у своєму виході. Це говорить про те, що ви можете переглянути розбіжність між ними.
whuber

Я читав пост на вашому гіперпосиланні.
Антоні Пареллада

Коефіцієнти піддаються експоненції: exp (coef (fit)).
Антоні Пареллада

Так: і як пояснено у моїй відповіді в цій темі, експоненція перехоплення дає вам шанси на референтний випадок.
whuber

Відповіді:


13

Я працюю над тим, щоб відповісти на моє запитання, розраховуючи вручну коефіцієнт шансів і шансів:

Acceptance   blue            red            Grand Total
0            158             102                260
1            112             177                289
Total        270             279                549

Тож коефіцієнт шансів потрапити в школу Червоного над Синім:

Оггс Аccеpт Яf RегОггс Аcccеpт Яf Блуе=177/102112/158=1.73530,7089=2.448

І це Backgroundredповернення:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))

                      Odds_and_OR                         2.5 %      97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

У той же час (Intercept)відповідає чисельнику коефіцієнта шансів , який саме є шансом на те, щоб бути "синім" сімейним фоном:112/158=0,7089.

Якщо замість цього, я запускаю:

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))

                        Odds            2.5 %      97.5 %
Backgroundblue     0.7088608        0.5553459   0.9017961
Backgroundred      1.7352941        1.3632702   2.2206569

Повернення - це саме шанс отримати «синій»: Backgroundblue(0.7089), а шанси прийняти «червоний»: Backgroundred(1.7353). Немає Odds Ratio там. Тому не очікується, що ці два повернені значення будуть взаємними.

Нарешті, як прочитати результати, якщо у категоричному регресорі є 3 фактори?

Те саме ручне обчислення проти [R]:

Я створив інший фіктивний набір даних із тією ж передумовою, але цього разу було три етнічні походження: "червоний", "синій" та "помаранчевий", і вони виконували однакову послідовність:

По-перше, таблиця надзвичайних ситуацій:

Acceptance  blue    orange  red   Total
0             86        65  130     281
1             64        42  162     268
Total        150       107  292     549

І підраховано шанси на вступ для кожної етнічної групи:

  • Коефіцієнти приймаються, якщо червоний = 1.246154;
  • Коефіцієнти приймаються, якщо синій = 0,744186;
  • Коефіцієнти приймаються, якщо помаранчевий = 0,646154

Як і різні коефіцієнти шансів :

  • АБО червоний v синій = 1,674519;
  • АБО червоний v помаранчевий = 1.928571;
  • АБО синій v червоний = 0,597186;
  • АБО синій v помаранчевий = 1,151717;
  • АБО помаранчевий v червоний = 0,518519; і
  • АБО помаранчевий v синій = 0,868269

І виходив із тепер рутинної логістичної регресії з наступною експоненцією коефіцієнтів:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))

                      ODDS     2.5 %   97.5 %
(Intercept)      0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred    1.6745192 1.1271430 2.497853

Поступившись шансами на отримання "блюзу" як (Intercept), і коефіцієнти коефіцієнта помаранчевого проти синього Backgroundorange, а АБО червоного проти синього Backgroundred.

З іншого боку, регресія без перехоплення передбачувано повернула лише три незалежні шанси :

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))

                      ODDS     2.5 %    97.5 %
Backgroundblue   0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred    1.2461538 0.9900426 1.5715814

Вітаємо, ви зробили чудову роботу, розібравшись у цьому.
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.