Помірна регресія: Чому ми обчислюємо термін * product * між прогнозами?


12

Поміркований регресійний аналіз часто використовується в соціальних науках для оцінки взаємодії двох або більше предикторів / коваріатів.

Як правило, з двома змінними прогностики застосовується наступна модель:

Y=β0+β1X+β2M+β3XM+e

Зауважте, що тест на помірність оперують продуктовим терміном XM (множенням між незалежною змінною X і змінною модератора M ). Моє дуже принципове питання: чому ми насправді обчислюємо термін виробу між X і M ? Чому б, наприклад, абсолютна різниця |MX|чи просто сума X+M ?

Цікаво, що Кенні натякає на цю проблему тут http://davidakenny.net/cm/moderation.htm , кажучи: "Як видно, тест на помірність не завжди функціонує терміном продукту XM", але більше пояснення не дається . Я думаю, що формальна ілюстрація чи доказ були б освічуючими.

Відповіді:


12

"Модератор" впливає на коефіцієнти регресії проти : вони можуть змінюватися у міру зміни значення модератора. Таким чином, у повній загальності є простою регресійною моделлю модераціїYX

E(Y)=α(M)+β(M)X

де і є функції сповільнювача , а не постійні , не порушені значення .αβMM

У тому ж дусі, в якому регресія заснована на лінійному наближенні співвідношення між і , ми можемо сподіватися, що обидва і є - принаймні приблизно - лінійними функціями у межах діапазону значень у даних:XYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Відмова від нелінійних ("big-O") термінів, сподіваючись, що вони занадто малі для значення, дає мультиплікативну (білінеарну) модель взаємодії

(1)E(Y)=α0+β0X+α1M+β1MX.

Ця деривація пропонує цікаву інтерпретацію коефіцієнтів: - швидкість, з якою змінює перехоплення, тоді як - швидкість, з якою змінює нахил . ( та - це нахил та перехоплення, коли (формально) встановлено нулем.) - коефіцієнт "термін продукту" . Він відповідає на питання таким чином:α1Mβ1Mα0β0Mβ1MX

Ми моделюємо модерацію з терміном продукту , коли ми очікуємо , що модератор буде (приблизно в середньому) має лінійну залежність з нахилом проти .MXMY X


Цікавим є те, що ця деривація вказує шлях до природного розширення моделі, що може запропонувати способи перевірити придатність. Якщо ви не переймаєтесь нелінійністю в ви або знаєте, або вважаєте, що модель є точною - тоді ви хочете розширити модель, щоб вона відповідала умовам, які випали:X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Тестування гіпотези оцінює корисність. Оцінка та може вказувати, яким чином модель може знадобитися розширити: включити нелінійність у (коли ) або більш складні модераційні відносини (коли ) чи можливо і те й інше. (Зауважте, що цей тест не запропонував би розширення ряду потужностей родової функції .)α2=β2=0α2β2(1)Mα20β20f(X,M)


Нарешті, якби ви виявили, що коефіцієнт взаємодії суттєво не відрізняється від нуля, але що придатність нелінійна (про що свідчить значне значення ), ви зробите висновок (а) є помірність, але ( б) вона не моделюється терміном , а натомість деякими термінами вищого порядку, що починаються з . Це може бути явище, на яке Кенні мав на увазі.β1β2MXM2X


8

Якщо ви використовуєте суму предикторів для моделювання їх взаємодії, ваше рівняння буде:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

де і . Тому ваша модель взагалі не матиме взаємодії. Зрозуміло, що це не так з продуктом.β1=β1+β3β2=β2+β3

Нагадаємо визначення абсолютного значення:

|XM|={XM,XMMX,X<M

Хоча ви можете зменшити модель до тієї, що має лише і , використовуючи def. забсолютне значення - це "спеціалізована форма поміркованості, яка навряд чи реальна в багатьох ситуаціях", як зазначено в коментарі нижче.β0+β1X+β2M+β3|XM|+eXM|XM|


1
Власне, включаючиТермін - демонстративно форма модерації: значення змінюється . Однак це обмежена спеціалізована форма поміркованості, яка навряд чи реальна в багатьох ситуаціях. Неправильно сказати, що така модель має "лише основні наслідки". |XM|Mβ2
whuber

1
Так, ви праві,є формою поміркованості, я захопився трансформацією і відповідно відредагую відповідь. Дякуємо, що вказали на це. |XM|
Мілош

@Milos: Ваш приклад щодо суми прогнозів був відкривачем очей, дещо бентежить, треба сказати, тому що я мав би вже усвідомити математичні наслідки;) whuber: Наскільки я зрозумів це, абсолютне значення корисне лише коли обидві змінні предиктора вимірюються в однакових одиницях (наприклад, два психометричні тести, використовуючи однакові показники, такі як z-бали або Т-бали). Абсолютна різниця між X і M є корисною метрикою, хоча не є єдиною можливою (тобто також може бути використаний термін продрозу).
знаменник

6

Ви не знайдете формального доказу використання мультиплікативного модератора. Ви можете підтримати такий підхід іншими способами. Наприклад, подивіться на розширення функції Тейлора-Маклауріна функції :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

Якщо ви підключите функцію такої форми в рівняння Тейлора, ви отримаєте це:f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

Отже, обґрунтування полягає в тому, що ця конкретна мультиплікативна форма помірності є в основному наближенням Тейлора другого порядку до загального відношення модераціїf(X,M)

ОНОВЛЕННЯ: якщо ви включите квадратичні терміни, як @whuber запропонував, це станеться: підключіть це до Тейлора:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

Це показує, що наша нова модель з квадратичними членами відповідає наближенню Тейлора повного другого порядку на відміну від оригінальної моделі модерації .g(X,M)f(X,M)


Оскільки основою вашого аргументу є розширення Тейлора, чому ви також не включили два інші квадратичні доданки та ? Щоправда, вони не є формами модерації, але їх включення до моделі зазвичай вплине на . X2M2βXM
whuber

@whuber, я вирішив залишити цю посаду короткою - ось головна причина. В іншому випадку я почав писати про свою перевагу включати умови другого порядку щоразу, коли у вас є перехресний термін, а потім вирізати його.
Аксакал
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.