Чому в лінійній регресії ми повинні включати квадратичні терміни, коли нас цікавлять лише терміни взаємодії?


10

Припустимо, мене цікавить модель лінійної регресії для , тому що я хотів би побачити, чи взаємодія між двома коваріатами впливає на Y.

Yi=β0+β1x1+β2x2+β3x1x2

У курсових записках професорів (з якими я не маю контактів) вказується: Якщо включати умови взаємодії, ви повинні включити їх умови другого ступеня. тобто повинні бути включені до регресії.

Yi=β0+β1x1+β2x2+β3x1x2+β4x12+β5x22

Чому слід включати терміни другого ступеня, коли нас цікавлять лише взаємодії?


7
Якщо модель має x1x2 , вона повинна включати x1 та x2 . Але x12 і x22 необов’язкові.
користувач158565

6
Думка вашого професора здається незвичною. Це може випливати із спеціалізованих передумов чи набору досвіду, оскільки "слід", безумовно, не є універсальною вимогою. Ви могли б знайти stats.stackexchange.com/questions/11009 бути якийсь - то інтерес.
whuber

@ user158565 привіт! Чи можу я запитати, чому ми також повинні включати та ? Я спочатку про це не думав, але тепер, коли ви це згадали ..! x1x2
дурник126

@whuber привіт! Дякуємо за посилання! Я думаю, що включення основного ефекту має сенс, але у мене виникли проблеми з тим, щоб включити умови другого порядку. // user158565 Я думаю, що посилання вище відповів на це, дякую!
дурень126

Надішліть, будь ласка, посилання на дані?
Джеймс Філліпс

Відповіді:


8

Це залежить від мети умовиводу. Якщо ви хочете зробити висновок про те, чи існує взаємодія, наприклад, у причинному контексті (або, загалом, якщо ви хочете інтерпретувати коефіцієнт взаємодії), ця рекомендація вашого професора має сенс, і вона походить від факт, що неправильне визначення функціональної форми може призвести до неправильних умовиводів про взаємодію .

Ось простий приклад, коли в структурному рівнянні немає терміна взаємодії між та , але, якщо ви не включите квадратичний доданок , ви помилково зробите висновок, що взаємодіє з оскільки насправді це не так ' т.x1x2yx1x1x2

set.seed(10)
n <- 1e3
x1 <- rnorm(n)
x2 <- x1 + rnorm(n)
y <- x1 + x2 + x1^2 + rnorm(n)
summary(lm(y ~ x1 + x2 + x1:x2))

Call:
lm(formula = y ~ x1 + x2 + x1:x2)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.7781 -0.8326 -0.0806  0.7598  7.7929 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.30116    0.04813   6.257 5.81e-10 ***
x1           1.03142    0.05888  17.519  < 2e-16 ***
x2           1.01806    0.03971  25.638  < 2e-16 ***
x1:x2        0.63939    0.02390  26.757  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.308 on 996 degrees of freedom
Multiple R-squared:  0.7935,    Adjusted R-squared:  0.7929 
F-statistic:  1276 on 3 and 996 DF,  p-value: < 2.2e-16

Це можна інтерпретувати як просто випадок упущеної змінної зміщення, і тут - це опущена змінна. Якщо ви повернетесь і включите у регресію квадратний термін, очевидна взаємодія зникає.x12

summary(lm(y ~ x1 + x2 + x1:x2 + I(x1^2)))   

Call:
lm(formula = y ~ x1 + x2 + x1:x2 + I(x1^2))

Residuals:
    Min      1Q  Median      3Q     Max 
-3.4574 -0.7073  0.0228  0.6723  3.7135 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.0419958  0.0398423  -1.054    0.292    
x1           1.0296642  0.0458586  22.453   <2e-16 ***
x2           1.0017625  0.0309367  32.381   <2e-16 ***
I(x1^2)      1.0196002  0.0400940  25.430   <2e-16 ***
x1:x2       -0.0006889  0.0313045  -0.022    0.982    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.019 on 995 degrees of freedom
Multiple R-squared:  0.8748,    Adjusted R-squared:  0.8743 
F-statistic:  1739 on 4 and 995 DF,  p-value: < 2.2e-16

Звичайно, це міркування стосується не лише квадратичних термінів, але неправильного визначення функціональної форми загалом. Метою тут є моделювання функції умовного очікування відповідним чином для оцінки взаємодії. Якщо ви обмежуєте себе моделюванням за допомогою лінійної регресії, тоді вам потрібно буде включити ці нелінійні умови вручну. Але альтернативою є використання гнучкішого моделювання регресії, наприклад, регресія хребта ядра .


Дякую @CarlosCinelli, на закінчення ви хочете сказати, що ми повинні включати терміни однакового ступеня - щоб врахувати потенційне неправильне визначення функціональної форми - і нехай регресія визначить, які терміни є важливими?
дурник126

3
@KevinC тут головне питання: чи хочете ви інтерпретувати термін взаємодії? Якщо це зробити, то неправильне визначення функціональної форми - справжнє питання. Додавання квадратичних доданків - це лише один простий спосіб фіксації нелінійностей, але загальним питанням є належне моделювання функції умовного очікування.
Карлос Сінеллі

1
Будь ласка, не включайте rm(list=ls())в код, розміщений тут! Якщо люди просто копіюють і вставляють і запускають код, вони можуть отримати сюрприз ... Я його поки видалив.
kjetil b halvorsen

3

Дві моделі, які ви вказали у своїй відповіді, можна повторно висловити, щоб зрозуміти, як ефект постулюється залежно від (або навпаки) у кожній моделі.X1X2

Першу модель можна повторно виразити так:

Y=β0+(β1+β3X2)X1+β2X2+ϵ,

що показує, що в цій моделі передбачається, що він має лінійний вплив на (керуючи ефектом ), але величина цього лінійного ефекту - захоплений коефіцієнтом нахилу - лінійно змінюється як функція . Наприклад, вплив на може збільшуватися по мірі збільшення значень .X1YX2X1X2X1YX2

Другу модель можна повторно виразити так:

Y=β0+(β1+β3X2)X1+β4X12+β2X2+β5X22+ϵ,

що показує, що в цій моделі вплив на (керуючи ефектом ) вважається квадратичним, а не лінійним. Цей квадратичний ефект фіксується, включаючи в модель як і . Хоча коефіцієнт вважається незалежним від , вважається , що коефіцієнт лінійно залежить від .X1YX2X1X12X12X2X1X2

Використання будь-якої моделі означає, що ви робите абсолютно різні припущення щодо природи впливу на (контролюючи ефект ).X1YX2

Зазвичай люди підходять до першої моделі. Потім вони можуть побудувати залишки цієї моделі проти та по черзі. Якщо залишки виявляють у залишках квадратичну картину як функцію та / або , модель може бути відповідно доповнена таким чином, щоб вона включала та / або (і, можливо, їх взаємодію).X1X2X1X2X12X22

Зауважте, що я спростив позначення, які ви використовували для послідовності, а також зробив явний термін помилки в обох моделях.


2
Привіт @IsabellaGhement, дякую за пояснення. Підсумовуючи це, насправді немає "правил" у тому, що нам слід додати квадратичні терміни, якщо ми включимо умови взаємодії. Зрештою, це повертається до припущень, які ми робимо щодо нашої моделі, та результатів нашого аналізу (тобто залишкових ділянок). Це правильно? Знову дякую :)!
дурник126

2
Правильно, Кевін! Не існує "правил", оскільки кожен набір даних різний і також призначений для відповіді на різні запитання. Ось чому нам важливо усвідомлювати, що кожна модель, яку ми підходимо до цього набору даних, передбачає різні припущення, які повинні бути підтримані даними, щоб ми могли довіряти результатам моделі. Діагностичні графіки моделей (наприклад, графік залишків та встановлених значень) допомагають нам перевірити, в якій мірі - якщо такі є - дані підтримують припущення моделі.
Ізабелла Гемен

1
@KevinC: Чудово! Зі святом тобі теж, Кевін! ☃🎉🎁🎈
Ізабелла Ґемент
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.