У мене є два основні ефекти, V1 і V2. Вплив V1 і V2 на змінні відповіді негативний. Однак я чомусь отримую позитивний коефіцієнт для терміна взаємодії V1 * V2. Як я можу це інтерпретувати? чи можлива така ситуація?
У мене є два основні ефекти, V1 і V2. Вплив V1 і V2 на змінні відповіді негативний. Однак я чомусь отримую позитивний коефіцієнт для терміна взаємодії V1 * V2. Як я можу це інтерпретувати? чи можлива така ситуація?
Відповіді:
Звичайно. Як простий приклад, розгляньте експеримент, коли ви додаєте певний об'єм гарячої (V1) та холодної (V2) води до ємності з рибою, яка починається з правильної температури. Змінна відповіді (V3) - це кількість риб, які виживають через добу. Інтуїтивно, якщо додати лише гарячу воду (V1 збільшується), багато риби загине (V3 знижується). Якщо додати лише холодну воду (збільшується V2), багато риби загине (V3 знижується). Але якщо додати як гарячу, так і холодну воду (V1 і V2 збільшується, таким чином, V1 * V2 збільшується), риба буде добре (V3 залишається високою), тому взаємодія повинна протидіяти двом основним ефектам і бути позитивною.
Нижче я склав 18 точок даних, що імітують вищевказану ситуацію та підходили до декількох лінійних регресій у R та включали вихід. Два останніх негативних ефекту та позитивної взаємодії можна побачити в останньому рядку. Ви можете пустити V1 = літрів гарячої води, V2 = літрів холодної води та V3 = кількість живих риб через один день.
V1 V2 V3
1 0 0 100
2 0 1 90
3 1 0 89
4 1 1 99
5 2 0 79
6 0 2 80
7 2 1 91
8 1 2 92
9 2 2 99
10 3 3 100
11 2 3 88
12 3 2 91
13 0 3 70
14 3 0 69
15 3 3 100
16 4 0 61
17 0 4 60
18 4 2 82
A = matrix(c(0,0,100, 0,1,90, 1,0,89, 1,1,99, 2,0,79, 0,2,80, 2,1,91, 1,2,92,
2,2,99, 3,3,100, 2,3,88, 3,2,91, 0,3,70, 3,0,69, 3,3,100, 4,0,61, 0,4,60,
4,2, 82), byrow=T, ncol=3)
A = as.data.frame(A)
summary(lm(V3~V1+V2+V1:V2, data=A))
Coefficients:
(Intercept) V1 V2 V1:V2
103.568 -10.853 -10.214 6.563
Альтернативний погляд на ситуацію на блискучий приклад @ underminer - зауважити, що при регресії квадратів принаймні квадрати ваші встановлені значення задовольняють "кореляційним обмеженням".