Щоб дістатися туди, нам знадобиться певний час, але, підсумовуючи, зміна змінної, що відповідає одній одиниці B, збільшить відносний ризик результату (порівняно з базовим результатом) на 6.012.
Це можна виразити як збільшення на 5012% відносного ризику, але це заплутаний і потенційно оманливий спосіб зробити це, тому що це дозволяє нам думати про зміни додатково, коли насправді багаточленна логістична модель настійно спонукає нас до мислити мультиплікативно. Модифікатор "відносний" є суттєвим, оскільки зміна змінної одночасно змінює передбачувані ймовірності всіх результатів, а не лише того, про який йдеться, тому нам доведеться порівнювати ймовірності (за допомогою коефіцієнтів, а не різниць).
Решта цієї відповіді розвиває термінологію та інтуїцію, необхідну для правильного тлумачення цих тверджень.
Фон
Почнемо зі звичайної логістичної регресії, перш ніж переходити до мультиноміального випадку.
Для залежної (бінарної) змінної та незалежних змінних X i модель єYXi
Pr[Y=1]=exp(β1X1+⋯+βmXm)1+exp(β1X1+⋯+βmXm);
еквівалентно, якщо вважати ,0≠Pr[Y=1]≠1
log(ρ(X1,⋯,Xm))=logPr[Y=1]Pr[Y=0]=β1X1+⋯+βmXm.
(Це просто визначає , що є шансами як функцією X i .)ρXi
Не втрачаючи загальності, індексуйте так, що X m є змінною, а β m - "B" у питанні (так що exp ( β m ) = 6,012 ). Фіксація значення X я , 1 ≤ я < м , і варіюючи X м на малу величину & delta ; виходиXiXmβmexp(βm)=6.012Xi,1≤i<mXmδ
log(ρ(⋯,Xm+δ))−log(ρ(⋯,Xm))=βmδ.
Таким чином, - гранична зміна логічних коефіцієнтів щодо X m .βm Xm
Щоб відновити , очевидно, ми повинні встановити δ = 1 і експоненціювати ліву частину:exp(βm)δ=1
exp(βm)=exp(βm×1)=exp(log(ρ(⋯,Xm+1))−log(ρ(⋯,Xm)))=ρ(⋯,Xm+1)ρ(⋯,Xm).
Це показує як коефіцієнт шансів на одно-одиничне збільшення X m . Щоб розвинути інтуїцію щодо того, що це може означати, складіть таблицю деяких значень для діапазону стартових шансів, сильно округлюючи, щоб шаблони виділялися:exp(βm)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
Для дуже маленьких шансів, що відповідає дуже малих ймовірностей, ефект збільшення на одну одиницю в , щоб помножити шанси або ймовірність приблизно 6,012. Мультиплікативний коефіцієнт зменшується, коли шанси (та ймовірність) збільшуються, і по суті зникає, коли шанси перевищують 10 (ймовірність перевищує 0,9).Xm
Як зміна добавки , велика різниця між ймовірністю 0,0001 і 0,0006 (це лише 0,05%), а також різницею між 0,99 та 1 (лише 1%). Найбільший аддитивний ефект виникає, коли коефіцієнт дорівнює , де ймовірність змінюється від 29% до 71%: зміна + 42%.1/6.012−−−−√∼0.408
Тоді ми бачимо, що якщо ми виражаємо "ризик" як коефіцієнт шансів, = "B" має просту інтерпретацію - коефіцієнт шансів дорівнює β m для одиничного збільшення X m -, але коли ми виражаємо ризик у деякі інші способи, такі як зміна ймовірностей, інтерпретація вимагає обережності для визначення початкової ймовірності.βmβmXm
Багаточленна логістична регресія
(Це було додано як пізніша редакція.)
Визнавши значення використання коефіцієнтів журналу для вираження шансів, перейдемо до мультиноміального випадку. Тепер залежна змінна може дорівнювати одній з k ≥ 2 категорій, індексованій i = 1 , 2 , … , k . Відносна ймовірність того, що вона знаходиться в категорії я єYk≥2i=1,2,…,ki
Pr[Yi]∼exp(β(i)1X1+⋯+β(i)mXm)
з параметрами які слід визначити, і записуючи Y i для Pr [ Y = категорія i ] . Як абревіатуру, запишемо правий вираз у вигляді p i ( X , β ) або, де X і β зрозумілі з контексту, просто p i . Нормалізація для зведення всіх цих відносних ймовірностей дорівнює одиниціβ(i)jYiPr[Y=category i]pi(X,β)Xβpi
Pr[Yi]=pi(X,β)p1(X,β)+⋯+pm(X,β).
(У параметрах є неоднозначність: їх занадто багато. Зазвичай, для порівняння вибирають "базову" категорію і змушують усі її коефіцієнти дорівнювати нулю. Однак, хоча це необхідно для повідомлення унікальних оцінок бета, воно НЕ потрібно інтерпретувати коефіцієнти для підтримки симетрії -. тобто, щоб уникнути будь - яких штучних відмінностей між категоріями - давайте не будемо застосовувати будь-яке таке обмеження , якщо ми не повинні).
Одним із способів інтерпретації цієї моделі є запит граничної швидкості зміни коефіцієнта журналу для будь-якої категорії (скажімо, категорія ) стосовно будь-якої з незалежних змінних (скажімо, X j ). Тобто, коли ми трохи змінимо X j , це викликає зміну логічного шансу Y i . Нас цікавить константа пропорційності, що стосується цих двох змін. Правило ланцюга обчислення разом з невеликою алгеброю говорить нам, що така швидкість змін єiXjXjYi
∂ log odds(Yi)∂ Xj=β(i)j−β(1)jp1+⋯+β(i−1)jpi−1+β(i+1)jpi+1+⋯+β(k)jpkp1+⋯+pi−1+pi+1+⋯+pk.
Це має порівняно просту інтерпретацію, оскільки коефіцієнт від X j у формулі для того, що Y є у категорії i за вирахуванням "коригування". Корекція - це середньозважене на вірогідність коефіцієнти X j у всіх інших категоріях . Ваги обчислюються з використанням ймовірності , пов'язану з поточними значеннями незалежних змінних X . Таким чином, гранична зміна журналів не обов'язково є постійною: це залежить від ймовірності всіх інших категорій, а не лише від ймовірності відповідної категорії (категорія iβ(i)jXjYiXjXi).
Коли є лише категорії, це повинно зводитися до звичайної логістичної регресії. Дійсно, зважування ймовірності нічого не робить і (вибираючи i = 2 ) дає просто різницю β ( 2 ) j - β ( 1 ) j . Нехай базова категорія i є базовим випадком, зводить це далі до β ( 2 ) j , тому що ми примушуємо β ( 1 ) j = 0 . Таким чином нова інтерпретація узагальнює стару.k=2i=2β(2)j−β(1)jiβ(2)jβ(1)j=0
Щоб інтерпретувати безпосередньо, тоді ми виділимо його на одній стороні попередньої формули, що веде до:β(i)j
Коефіцієнт для категорії я дорівнює граничним зміна в журналі шанси категорії I по відношенню до змінної X J , плюс ймовірність-зважене середнє коефіцієнтів всіх інших X J ' для категорії я .XjiiXjXj′i
Інша інтерпретація, хоча і дещо менш пряма, надається (тимчасово) встановленням категорії як основного випадку, таким чином, роблячи β ( i ) j = 0 для всіх незалежних змінних X j :iβ(i)j=0Xj
Гранична швидкість зміни коефіцієнтів журналу базового випадку для змінної - це від'ємне значення середньозваженого на вірогідність його коефіцієнтів для всіх інших випадків.Xj
Насправді використання цих інтерпретацій зазвичай вимагає вилучення бета-версій та ймовірностей з виведення програмного забезпечення та виконання обчислень, як показано.
Нарешті, для коефіцієнтів експоненціації зауважте, що відношення ймовірностей між двома результатами (іноді їх називають "відносним ризиком" порівняно з i ' )ii′
YiYi′=pi(X,β)pi′(X,β).
Збільшимо на одну одиницю до X j + 1 . Це множимо p i на exp ( β ( i ) j ) і p i ′ на exp ( β ( i ′ ) j ) , звідки відносний ризик помножується на exp ( β ( i ) j ) / exp ( β ( i ′) ) j )XjXj+1piexp(β(i)j)pi′exp(β(i′)j)exp(β(i)j)/exp(β(i′)j)= . Приймаючи категорію i ' як базовий випадок, це зводить це до exp ( β ( i ) j ) , що призводить нас до того, щоб сказати,exp(β(i)j−β(i′)j)i′exp(β(i)j)
Експонентний коефіцієнт - це сума, на яку відносний ризик Pr [ Y = категорія i ] / Pr [ Y = базова категорія ] множиться, коли змінна X j збільшується на одну одиницю.exp(β(i)j)Pr[Y=category i]/Pr[Y=base category]Xj