Експонентний коефіцієнт логістичної регресії відрізняється від коефіцієнта шансів


10

Як я розумію, показник бета-експоненції від логістичної регресії є коефіцієнтом шансів цієї змінної для залежної змінної, що цікавить. Однак значення не відповідає розрахованому вручну коефіцієнту шансів. Моя модель передбачає затримку (міру недоїдання), використовуючи, серед інших показників, страхування.

// Odds ratio from LR, being done in stata
logit stunting insurance age ... etc. 
or_insurance = exp(beta_value_insurance)

// Odds ratio, manually calculated
odds_stunted_insured = num_stunted_ins/num_not_stunted_ins
odds_stunted_unins = num_stunted_unins/num_not_stunted_unins
odds_ratio = odds_stunted_ins/odds_stunted_unins

У чому концептуальна причина цих цінностей відрізняється? Контроль за іншими факторами регресії? Просто хочу вміти пояснити невідповідність.


2
Чи додаєте ви додаткові прогнози до моделі логістичної регресії? Коефіцієнт шансів, розрахований вручну, буде відповідати лише коефіцієнту шансів, який ви вийдете з логістичної регресії, якщо ви не включите інших прогнозів.
Макрос

Це я зрозумів, але хотів підтвердження. Це тому, що в результаті регресу облік зміни в інших прогнозах?
Майк

Так, @mike Якщо припустити, що модель вказана правильно, ви можете інтерпретувати її як коефіцієнт шансів, коли всі інші прогнози всі виправлені.
Макрос

@Macro: чи не проти повторити коментар як відповідь?
jrennie

Відповіді:


22

Якщо ви тільки вкладаєте цього самотнього прогноктора в модель, тоді коефіцієнт шансів між предиктором і відповіддю буде точно рівний експоненційному коефіцієнту регресії . Я не думаю, що виведення цього результату присутнє на сайті, тому я скористаюся цією можливістю, щоб надати його.


Розглянемо бінарний результат та одинарний бінарний предиктор X :YХ

Y=1Y=0Х=1p11p10Х=0p01p00

Тоді одним із способів обчислити коефіцієнт шансів між та Y i єХiYi

ОR=p11p00p01p10

pij=П(Y=i|Х=j)П(Х=j)ХY|Х

ОR=П(Y=1|Х=1)П(Y=0|Х=1)П(Y=0|Х=0)П(Y=1|Х=0)

При логістичній регресії ви моделюєте ці ймовірності безпосередньо:

журнал(П(Yi=1|Хi)П(Yi=0|Хi))=β0+β1Хi

Отже ми можемо обчислити ці умовні ймовірності безпосередньо з моделі. Перше співвідношення в виразі для вище:ОR

П(Yi=1|Хi=1)П(Yi=0|Хi=1)=(11+е-(β0+β1))(е-(β0+β1)1+е-(β0+β1))=1е-(β0+β1)=е(β0+β1)

а друге:

П(Yi=0|Хi=0)П(Yi=1|Хi=0)=(е-β01+е-β0)(11+е-β0)=е-β0

ОR=е(β0+β1)е-β0=еβ1

Z1,...,Zp

П(Y=1|Х=1,Z1,...,Zp)П(Y=0|Х=1,Z1,...,Zp)П(Y=0|Х=0,Z1,...,Zp)П(Y=1|Х=0,Z1,...,Zp)

тому коефіцієнт шансів залежить від значень інших предикторів у моделі та, як правило, не рівний

П(Y=1|Х=1)П(Y=0|Х=1)П(Y=0|Х=0)П(Y=1|Х=0)

Тож не дивно, що ви спостерігаєте невідповідність коефіцієнта експоненції та спостережуваного коефіцієнта шансів.

β


2
Вау, дякую, що знайшли час, щоб написати таке повне пояснення.
Майк

@Macro Я виявив, що "значення p менше ніж 0,05" і "95% ДІ не включає 1" не відповідають послідовності логістичної регресії (я використовував SAS). Чи пов’язане це явище з вашим поясненням?
користувач67275

4

досвід(β)

мку вашій моделі, але також є проблеми, якщо справжня залежність змінюється в різних рівнях іншого коваріату, але термін взаємодії, наприклад, не включений. логістичної регресійної моделі, ми можемо задати питання, коли будуть залежати коефіцієнти шансів на основі моделі та граничні коефіцієнти, і яким слід віддати перевагу, коли вони роблять?

0/1r0досвід(β)

Якщо граничні АБО та АБО на основі моделі відрізняються, слід використовувати / інтерпретувати версію на основі моделі. Причина полягає в тому, що гранична АБО не враховує заплутаність серед ваших коваріатів, тоді як модель це робить. Це явище пов'язане з парадоксом Сімпсона , який ви можете захотіти прочитати про (SEP також має хороший вхід , є обговорення резюме тут: Basic-simpson's-парадокс , і ви можете знайти на анкетному тега). Для простоти та практичності ви можете просто використовувати лише модель на основі АБО, оскільки вона буде або явно кращою, або однаковою.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.