Інтерпретація коефіцієнтів взаємодії категоріальної та безперервної змінної


10

У мене є питання про інтерпретацію коефіцієнтів взаємодії між неперервною та категоричною змінною. ось моя модель:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ***

скажемо рівняння моделі:

E [cog] = a + b1 (lg_hag) + b2 (educa2 * lg_hag) + b3 (educa3 * lg_hag) + b4 (educa4 * lg_hag) + b5 (pdg, в центрі) + інші ковари, де

b1 = difference in cog  with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg

Моє запитання: якщо моя інтерпретація правильна, як побудувати інтервали довіри для кожної оцінки ефектів взаємодій (наприклад: b1 + b2) з довірчих інтервалів b1 та b2.


не дуже знайомий з тим, як це зробити в Р. припустимо, у sas можна отримати результат за допомогою заяви "оцінка", зверніться до support.sas.com/documentation/cdl/en/statug/63033/HTML/default/…
boomean

Відповіді:


8

Ваша інтерпретація коефіцієнтів моделі не зовсім точна. Дозвольте спершу підсумувати умови моделі.

Категоричні змінні (фактори): race, sex, і educa

Коефіцієнт raceмає чотири рівні:race={white,black,mexican,multi/other}.

Коефіцієнт sexмає два рівні:sex={male,female}.

Коефіцієнт educaмає п'ять рівнів:educa={1,2,3,4,5}.

За замовчуванням R використовує контрасти лікування для категоричних змінних. У цих контрастах перше значення коефіцієнта використовується опорним рівнем, а решта значення перевіряються на еталонне. Максимальна кількість контрастів для категоріальної змінної дорівнює кількості рівнів мінус один.

Контрасти raceдозволяють перевірити наступні відмінності: race=black vs.race=white, race=mexican vs.race=white, і race=multi/other vs.race=white.

За фактором educa, еталонний рівень є 1, закономірність контрастів аналогічна. Ці ефекти можна інтерпретувати як різницю залежної змінної. У вашому прикладі середнє значення cog-13.8266 одиниць вище для educa=2 у порівнянні з educa=1( as.factor(educa)2).

Одне важливе зауваження: Якщо в моделі є контрасти лікування категоріальної змінної, оцінка подальших ефектів базується на еталонному рівні категоріальної змінної, якщо також включаються взаємодії між подальшими ефектами та категоріальною змінною. Якщо змінна не є частиною взаємодії, її коефіцієнт відповідає середньому рівню окремих нахилів підмножини цієї змінної уздовж усіх решти категоричних змінних. Наслідкиrace і educaвідповідають середнім ефектам щодо рівнів факторів інших змінних. Для перевірки загальних ефектівrace, вам потрібно було б піти educa і sex поза моделлю.

Числові змінні: lg_hag і pdg

Обидва lg_hagі pdgє числовими змінними, отже, коефіцієнти являють собою зміну залежної змінної, пов'язану зі збільшенням1 в провіснику.

В принципі, тлумачення цих ефектів є прямим. Але зауважте, що за наявності інтеграцій, оцінка коефіцієнтів базується на еталонних категоріях факторів (якщо застосовуються контрасти лікування). З тих пірpdgне є частиною взаємодії, її коефіцієнт підводиться до середнього нахилу змінної відносно. Змінналг_годаг також є частиною взаємодії з егуcа. Тому його дія справедливаегуcа=1, базовий рівень; це не перевірка загального впливу числової змінноїлг_годаг незалежно від рівня факторів.

Взаємодія між категоричними та числовими змінними: лг_годаг×егуcа

Модель включає не тільки основні ефекти, а й взаємодії між числовою змінною лг_годаг і чотири контрасти, пов'язані з егуcа. Ці ефекти можна інтерпретувати як різницю у схилахлг_годаг між певним рівнем егуcа і контрольний рівень (егуcа=1).

Наприклад, коефіцієнт lg_hag:as.factor(educa)2( -21.2224) означає цей нахиллг_годаг є 21.2224 одиниці нижче для егуcа=2 у порівнянні з егуcа=1.


"Ці коефіцієнти взаємодії також утримуються race=whiteі є sex=maleлише." Ви впевнені в цьому? Я прошу, бо ні те, raceні sexвзаємодіє з lg_hag×educaтерміном ... Я переглядаю кілька текстів, я не бачу цього прямо вказаного.
landroni

2
@landroni Схили оцінюються в точці, коли всі інші прогнози дорівнюють 0.
Свен Хогенштайн

Так, це теж моє розуміння. Усі інші прогнози утримуються постійними, це означає, що фактори фіксуються до їх базового рівня. Але в цьому криється моя загадка: я переглянув кілька книг, які, здається, здебільшого змальовують цей тонкий, але далекосяжний нюанс. Більше того, документи часто "контролюють галузь", але роблять висновки, ніби коефіцієнти були безумовними щодо повного зразка, замість того, щоб виділяти, що це лише для базового рівня. Див. Також: stats.stackexchange.com/questions/146665/ …
landroni

1
"Якщо в моделі присутній контраст щодо категоричної змінної, оцінка подальших ефектів базується на еталонному рівні категоріальної змінної." Після подальшого розгляду я не переконаний (або я повністю не дотримуюся ваших аргументів). Здається, ви розумієте, що оцінка бета-версії, наприклад, pdgзалежить від еталонного рівня, що, очевидно, не так. Якщо я зміню базовий рівень будь-якого з факторів (наприклад sex), оцінка для pdgНЕ зміниться ...
landroni

1
@landroni Дякую, що вказали. Ви маєте рацію, це твердження вводить в оману. Насправді це стосується лише прогнозів, які також є частиною термінів взаємодії з категоричними змінними. Отже, оцінка pdgдійсно не залежить від конкретизації контрастів. Відповідь я модифікую відповідно.
Свен Хогенштайн
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.