Як інтерпретувати коефіцієнти в пуассоновій регресії?


64

Як я можу інтерпретувати основні ефекти (коефіцієнти для матричного коефіцієнта) в регресії Пуассона?

Припустимо наступний приклад:

treatment     <- factor(rep(c(1, 2), c(43, 41)), 
                        levels = c(1, 2),
                        labels = c("placebo", "treated"))
improved      <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
                        levels = c(1, 2, 3),
                        labels = c("none", "some", "marked"))    
numberofdrugs <- rpois(84, 10) + 1    
healthvalue   <- rpois(84, 5)   
y             <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test          <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)

Вихід:

Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       1.88955    0.19243   9.819   <2e-16 ***
numberofdrugs    -0.02303    0.01624  -1.418    0.156    
treatmenttreated -0.01271    0.10861  -0.117    0.907   MAIN EFFECT  
improvedsome     -0.13541    0.14674  -0.923    0.356   MAIN EFFECT 
improvedmarke    -0.10839    0.12212  -0.888    0.375   MAIN EFFECT 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Я знаю, що показник інциденту numberofdrugsє exp(-0.023)=0.977. Але як я інтерпретую основні ефекти для фіктивних змінних?


Аналогічну відповідь (але оформлену більш математично) можна знайти тут: Як інтерпретувати оцінки параметрів у результатах Poisson GLM .
gung - Відновіть Моніку

Цікаво, що згадане питання було закрито як поза темою. (Я б не погодився, що це поза темою, оскільки будь-яка відповідь також застосовуватиметься до виводу будь-якої програми статистики, яка повертає таблицю коефіцієнтів користувачеві, і я погоджуюся з вами, що вона є гідною на основі як дублікат.) Мені здається, що спільнота SO занадто "тісна" щодо питань, що задають інтерпретацію результатів від R. Вони насправді не є темою для StackOverflow, оскільки немає припущення, що потрібна допомога з кодування.
DWin

@DWin, я не думаю, що інтерпретація статистичних результатів не є темою для Cross Validated . Я проголосував за закриття цього питання як дубліката цього. Інші, здається, проголосували ОТ, я збираюся, тому що їм здавалося, що ОП "скидає [видає] свій комп'ютерний вихід і [сподівається, що хтось] запустить аналіз статистики для [них]".
gung - Відновити Моніку

1
@gung: Я зрозумів, що це не ти називаєш це ЗЗ. Ваші коментарі були чіткими з цього приводу. (Я думав, що я згоден з вами.) "Причина", зазначена при закритому голосуванні, часто є рішенням більшості чи множинності.
DWin

Відповіді:


56

Експонентний numberofdrugsкоефіцієнт - це мультиплікативний термін, який слід використовувати для обчислення розрахункових healthvalueпри numberofdrugsзбільшенні на 1 одиницю. У разі категоричних (факторних) змінних коефіцієнт експоненціалу є мультиплікативним терміном відносно базового (першого коефіцієнта) рівня для цієї змінної (оскільки R використовує контрасти лікування за замовчуванням). Це exp(Intercept)базовий показник, і всі інші оцінки були б відносно нього.

У вашому прикладі підрахунок healthvalueдля когось із 2наркотиками, "placebo"і improvement=="none"буде (використовуючи додавання всередині досвіду як еквівалент множення):

 exp( 1.88955 + 2*-0.02303 + 0 + 0 )
 [1] 6.318552

У той час як хто - то на 4наркотики, "treated"і "some"поліпшення було б , за оцінками , healthvalueв

exp( 1.88955 + 4*-0.02303 + -0.01271 + -0.13541)
[1] 5.203388

ДОПОМОГА: Це те, що означає бути "добавкою за шкалою журналу". "Добавка за шкалою відхилень від журналу" - це фраза, яку моя вчителька Барбара МакКайнд використовувала, підкреслюючи необхідність використання всіх термінових коефіцієнтів, які застосовувались при логістичній регресії під час будь-якого прогнозування. Ви додаєте спочатку всі коефіцієнти в рази значення коваріату, а потім виставляєте. Спосіб повернення коефіцієнтів з об'єктів регресії в R - це, як правило, використання функції coef()екстрактора (виконується з іншою випадковою реалізацією нижче):

 coef(test)
  #   (Intercept)    numberofdrugs treatmenttreated     improvedsome   improvedmarked 
  #   1.18561313       0.03272109       0.05544510      -0.09295549       0.06248684 

Таким чином, розрахунок оцінки для суб'єкта з 4наркотиками "treated", з "some"поліпшенням буде:

 exp( sum( coef(test)[ c(1,2,3,4) ]* c(1,4,1,1) ) ) 
 [1] 3.592999

І лінійний предиктор для цього випадку повинен бути сумою:

 coef(test)[c(1,2,3,4)]*c(1,4,1,1) 
 #    (Intercept)    numberofdrugs treatmenttreated     improvedsome 
 #     1.18561313       0.13088438       0.05544510      -0.09295549

Ці принципи повинні застосовуватися до будь-якого пакету статистики, який повертає таблицю коефіцієнтів користувачеві. Метод та принципи є більш загальними, ніж це могло б з’явитись із мого використання Р.


Я копіюю вибрані уточнюючі коментарі, оскільки вони 'зникають' на дисплеї за замовчуванням:

З: Отже, ви інтерпретуєте коефіцієнти як відношення! Дякую! - MarkDollar

A: Коефіцієнти - це природні_логіаритми співвідношень. - DWin

Q2: У такому випадку, при погресовій регресії, коефіцієнти експоненції також називаються "коефіцієнтами шансів"? - оорт

A2: Ні. Якби це була логістична регресія, вони були б, але в регресії Пуассона, де LHS - це кількість подій, а неявний знаменник - число ризику, тоді коефіцієнти експоненціалу є "коефіцієнтами ставки" або "відносними ризиками".


Отже, це дозволить вам проголосувати двічі? Як добре. Я думав, що пропонування інтерпретації коду R може врятувати його від силових точок класифікації. ОП склала приємний самодостатній приклад. Можливо, я мав би продемонструвати функцію витяжки, тож я думаю, що стану.
DWin

Так, я підтримав вашу відповідь на ТАК, потім він перемістився сюди, і я знову схвалив :)
Брендон Бертелсен

Дякую поки що! Я знаю поняття між манекенами та перешкодами, але мене просто цікавить, як інтерпретувати Основні ефекти (я позначив їх). Чи можна взяти коефіцієнт нападів з основних ефектів, наприклад, для манекена, обробленого "exp (-0,012) = 0,99", і інтерпретувати його як швидкість, з якої зменшується ціннісний показник при переході від еталонної категорії до лікуваної? Це повинно бути, ні?
MarkDollar

Коефіцієнти експоненціації завжди інтерпретуються як відношення. Співвідношення "що" до "що" залежить від одиниць аналізу. "Тарифи" різні, мають неявне число та значення часу. Тож якщо ви готові змінити свою термінологію, то, можливо, "так". Найкращі відповіді виходять із повного опису ситуації з аналізом.
DWin

Ну добре, це те, що я хотів знати. Отже, ви інтерпретуєте коефіцієнти як співвідношення! Дякую!
MarkDollar
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.