Що робити, якщо взаємодія знищує мої прямі наслідки при регресії?


25

У регресії термін взаємодії знищує обидва пов'язані з цим прямі ефекти. Чи потрібно відмовитися від взаємодії чи повідомити про результат? Взаємодія не була частиною початкової гіпотези.


6
Ви, мабуть, зможете отримати кращу відповідь, якби ви надали більше деталей щодо експериментальної конструкції, дослідницького питання та статистичної моделі.
Девід Лебоуер

У мене є дані опитування, v1 і v2 прогнозують результат, як я очікував; однак взаємодія між v1 (дихотомічним) та v2 (5 групами) не є істотним - і (моє запитання) це робить мої прямі ефекти v1 та v2 також несуттєвими. Я не можу знайти приклад повідомлення про це в літературі.
Джен

Якщо взаємодія v1: v2 не є істотною, чи потрібно її включати в модель?
Крістофер Аден

Може це питання актуальне? stats.stackexchange.com/questions/5184/…
Глен

Інша можливість Парадоксально спантеличивши: Приклад 1: epm.sagepub.com/content/56/3/430.abstract Приклад 2: optimalprediction.com/files/pdf/V1A19.pdf
user31256

Відповіді:


24

Я думаю, що це хитро; як ви натякаєте, тут є "моральна небезпека": якби ви взагалі не дивилися на взаємодію, ви були б вільними і зрозумілими, але тепер, коли у вас є, є підозра на зневоднення даних, якщо ви її відкинете.

Ключовим моментом є, мабуть, зміна значення ваших ефектів, коли ви переходите від основних ефектів до моделі взаємодії. Те, що ви отримуєте від «основних ефектів», дуже залежить від того, як закодуються ваші методи лікування та протиставлення. У R за замовчуванням обробляється контраст з першими рівнями факторів (тими, які мають імена в алфавітному порядку, якщо ви не вийшли зі шляху, щоб кодувати їх по-іншому) як базові рівні.

Скажіть (для простоти), що у вас є два рівні, «контроль» і «trt», для кожного фактора. Без взаємодії значення параметра "v1.trt" (якщо вважати контрастність лікування, як це за замовчуванням у R), "середня різниця між 'v1.control' та 'v1.trt' групою"; значення параметра "v2.trt" - "середня різниця між" v2.control "і" v2.trt "".

Під час взаємодії 'v1.trt' - це середня різниця між 'v1.control' та 'v1.trt' у групі 'v2.control' , і аналогічно 'v2.trt' - середня різниця між групами v2 у група 'v1.control'. Таким чином, якщо у вас є досить невеликі ефекти лікування в кожній з контрольних груп, але великий ефект у групах лікування, ви можете легко побачити те, що ви бачите.

Єдиний спосіб, коли я бачу, що це відбувається без значного терміну взаємодії, це, якщо всі ефекти є досить слабкими (так що ви дійсно маєте на увазі під впливом "ефект зник" - це те, що ви перейшли від p = 0,06 до p = 0,04, через лінію магічної значущості).

Інша можливість полягає в тому, що ви "використовуєте занадто багато ступенів свободи" - тобто оцінки параметрів насправді не так сильно змінюються, але термін залишкової помилки є достатньо завищеним через необхідність оцінки ще 4 [= (2- 1) * (5-1)] параметри, які ваші значущі терміни стають несуттєвими. Знову ж таки, я б очікував цього лише з невеликим набором даних / відносно слабкими ефектами.

Одне можливе рішення - перейти до суми контрастів, хоча це теж делікатно - ви повинні бути впевнені, що "середній ефект" має значення у вашому випадку. Найкраще - побудувати свої дані та переглянути коефіцієнти та зрозуміти, що відбувається з точки зору розрахункових параметрів.

Сподіваюся, що це допомагає.


4
Немає моральної небезпеки. Розрахунок основних ефектів із включеною взаємодією сильно відрізняється від розрахунку без нього. Вам потрібно зробити модель добавки, щоб повідомити про основні ефекти, а потім все одно включити взаємодію в окрему модель. Ви ігноруєте основні ефекти в моделі, яка включає взаємодію, оскільки вони насправді не є основними ефектами, вони впливають на конкретних рівнях інших прогнокторів (включаючи взаємодію).
Джон

Джон: чи за такою логікою можна ігнорувати термін взаємодії у моделі, що оцінює квадратичну дію / модеруючий ефект (тобто включаючи (1) основні ефекти, (2) взаємодію між цими основними ефектами та (3) квадратичний термін для одного з основних ефектів та ефекту криволінійної взаємодії (помірність)?
Бенто

11

Ви впевнені, що змінні були належним чином виражені? Розглянемо дві незалежні змінні і X 2 . Постановка проблеми стверджує, що ви добре вписуєтесь у формуX1X2

Y=β0+β12X1X2+ϵ

Y

Y=β0+(β12X1X2)δ

Це можна переписати

log(Yβ0)=log(β12)+log(X1)+log(X2)+log(δ);

тобто якщо ви повторно висловите свої змінні у формі

η=log(Yβ0)ξ1=log(X1)ξ2=log(X2)ζ=log(δ)N(0,σ2)

то модель лінійна і, ймовірно, має гомосептичні залишки:

η=γ0+γ1ξ1+γ2ξ2+ζ,

γ1γ2

β0Y

β0β0

Y=(θ1+X1)(θ2+X2)+ϵ

θ1θ2=β0θ1θ2θ1X2θ2X1ϵ

Цей аналіз показує, як можливо - навіть певно в деяких додатках - мати модель, в якій єдиними ефектами є взаємодії. Це виникає, коли змінні (незалежні, залежні або обидва) представлені вам у непридатній формі, а їх логарифми є більш ефективною ціллю для моделювання. Розподіли змінних та початкових залишків дають підказки, необхідні для визначення того, чи може це бути так: перекошені розподіли змінних та гетероскедастичність залишків (зокрема, мають відхилення, приблизно пропорційні прогнозованим значенням), є показниками.


Хммм. Це все здається правдоподібним, але складнішим, ніж моє рішення (коментарі до початкового питання говорять про те, що прогнози обидва категоричні). Але як завжди, відповідь - "подивіться на дані" (або залишки).
Бен Болкер

1
@ Я погоджуюся, але я не розумію, звідки береться сприйняття "складнішого", оскільки аналіз уніваріантних розподілів та пост-спеціальний аналіз залишків є важливими для будь-яких регресійних вправ. Тут потрібна лише додаткова робота - продумати, що означають ці аналізи.
whuber

1
Можливо, під "складнішим" я просто маю на увазі "У своєму досвіді я бачив, що проблеми, про які я згадував у своїй відповіді (контрастне кодування), виникають частіше, ніж ті, про які ви згадували (непридатність)" - але це справді твердження про види даних / людей, з якими я працюю, а не про світ.
Бен Болкер

5

Y=β0+β1Х1+β2Х2+β3(Х1Х2)=(б0+б2Х2)+(б1+б3Х2)Х1

Зазвичай це вводить високу мультиколінеарність, оскільки продукт сильно співвідноситься з обома оригінальними змінними. При мультиколінеарності окремі оцінки параметрів сильно залежать від того, які інші змінні враховуються - як у вашому випадку. Як протимір, центрирование змінних часто зменшує мультиколінеарність при розгляді взаємодії.

I'm not sure if this directly applies to your case since you seem to have categorical predictors but use the term "regression" instead of "ANOVA". Of course the latter case is essentially the same model, but only after choosing the contrast coding scheme as Ben explained.


5

This may be a problem of interpretation, a misunderstanding of what a so-called "direct effect" coefficient really is.

In regression models with continuous predictor variables and no interaction terms -- that is, with no terms that are constructed as the product of other terms -- each variable's coefficient is the slope of the regression surface in the direction of that variable. It is constant, regardless of the values of the variables, and is obviously a measure of the effect of that variable.

У моделях з взаємодіями - тобто з термінами, які будуються як продукти інших термінів - таку інтерпретацію можна зробити без додаткової кваліфікації лише для змінних, які не залучені до жодної взаємодії. Коефіцієнт змінної, яка бере участь у взаємодіях, - це нахил поверхні регресії у напрямку до цієї змінної, коли значення всіх змінних, які взаємодіють із змінною, про яку йдеться, дорівнюють нулю , а тест на значення коефіцієнта відноситься до нахил поверхні регресії лише в тій області простору прогноктора. Оскільки немає необхідності, щоб насправді існували дані у цій області простору, коефіцієнт очевидного прямого ефекту може мати незначну схожість зі схилом поверхні регресії в області простору прогноктора, де фактично спостерігалися дані. Не існує справжнього «прямого ефекту» в таких випадках; найкращим замінником, мабуть, є «середній ефект»: нахил поверхні регресії у напрямку до змінної, що приймається, взятої у кожній точці даних та усередненою по всіх точках даних. Докладніше про це див. У розділі Чому можуть центрирувати незалежні змінні змінити основні ефекти з помірністю?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.