Як інтерпретувати параметри в GLM з сім'єю = Gamma


21

У мене є питання щодо інтерпретації параметрів для GLM з розподіленою залежною змінною гамми. Це те, що R повертається для мого GLM за допомогою посилання:

Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool, 
    family = Gamma(link = log), data = fakesoep)

Deviance Residuals: 
       Min        1Q    Median        3Q       Max  
  -1.47399  -0.31490  -0.05961   0.18374   1.94176  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.2202325  0.2182771  28.497  < 2e-16 ***
height       0.0082530  0.0011930   6.918 5.58e-12 ***
age          0.0001786  0.0009345   0.191    0.848    
educat       0.0119425  0.0009816  12.166  < 2e-16 ***
married     -0.0178813  0.0173453  -1.031    0.303    
sex         -0.3179608  0.0216168 -14.709  < 2e-16 ***
language     0.0050755  0.0279452   0.182    0.856    
highschool   0.3466434  0.0167621  20.680  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Gamma family taken to be 0.1747557)

Null deviance: 757.46  on 2999  degrees of freedom
Residual deviance: 502.50  on 2992  degrees of freedom
AIC: 49184

Як інтерпретувати параметри? Якщо я обчислюю exp(coef())свою модель, я отримую ~ 500 за перехоплення. Тепер я вважаю, що це не означає очікуваний дохід, якщо всі інші змінні вважаються постійними, чи не так? Оскільки середня величина або mean(age)лежить на рівні 2000. Більше того, я не маю поняття, як інтерпретувати напрямок та значення коефіцієнтів коваріатів.


6
500 було б близько до очікуваного доходу, якби всі інші змінні були рівно нульовими (а не просто постійними) --- як і в регресії, насправді.
Glen_b -Встановіть Моніку

@Glen_b Чому можна було б очікувати доходу, коли експоненція коефіцієнтів є мультиплікативним впливом на дохід, коли є зміна пояснювальної змінної?
татамі

Обговорюваний випадок - це умовне значення, коли всі пояснювальні змінні дорівнюють 0.
Glen_b -Встановити Моніку

Відповіді:


25

Специфікація гамма-GLM, пов'язана з журналом, ідентична експоненціальній регресії:

E[y|x,z]=exp(α+βx+γz)=y^

E[y|x=0,z=0]=exp(α)

yxx

E[y|x,z]x=exp(α+βx+γz)β=y^β

xzxzy^βxy

x

E[y|z,x=1]E[y|z,x=0]=exp(α+β+γz)exp(α+γz)=exp(α+γz)(exp(β)1)

x

Третій метод - це експоненція коефіцієнтів. Зауважте, що:

E[y|z,x+1]=exp(α+β(x+1)+γz)=exp(α+βx+β+γz)=exp(α+βx+γz)exp(β)=E[y|z,x]exp(β)

x


1
Чи змогли б ви проілюструвати другу інтерпретацію?
татамі

@tatami Я виправив помилку у двійковій справі. Чи має тепер більше сенсу?
Мастеров Димитрій Вікторович

2

Спершу я б подивився на залишки, щоб побачити, наскільки добре підійде модель. Якщо це нормально, я б спробував використовувати інші функції посилань, якщо я не мав підстав вважати, що це дійсно походить від розповсюдження гамми. Якби гамма все ж виглядала переконливо, я б зробив висновок, що статистично значущими термінами є перехоплення, зріст, освіта, стать та середня школа (ті, що позначені трьома зірками). Між собою не можна сказати більше, якщо вони не стандартизовані (мають однаковий діапазон).

Відповідь на коментар: Зараз я краще розумію ваше запитання. Ви абсолютно можете це зробити! Збільшення одиниці висоти спричиняє довідку (0,0082530) -1 ~ = 0,0082530 (використовуючи приблизне значення x = 1 + x для малого х) відносну зміну доходу. Дуже легко інтерпретувати, ні?


1
Тож я не можу насправді інтерпретувати параметри, наприклад, дохід збільшується на xy, якщо висота збільшується на одиницю?

1
Зараз я вважаю, що мені доведеться тлумачити це мультиплікативно: exp (Intercept) * exp (висота) був би доходом із збільшенням на 1 одиницю. Дякую все-таки! :)
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.