як інтерпретувати термін взаємодії у формулі lm в R?


9

У R, якщо я називаю lm()функцію таким чином:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

Це дає мені лінійну модель змінної відгуку з var1, var2і взаємодія між ними. Однак як саме ми чисельно інтерпретуємо термін взаємодії?

У документації сказано , що це «хрест» між var1і var2, але це не дає пояснення того , що саме «хрест» є.

Було б корисно мені знати, які точні числа R обчислює, щоб включити взаємодію між двома змінними.


Чи хотіли б ви конкретно знати, як R створює матрицю проектування за цією формулою, або вас більше цікавить, як інтерпретувати такий мультиплікативний термін ("взаємодія") з точки зору пристосованої моделі?
Момо

Мене більше цікавить, як інтерпретувати цей мультиплікативний термін. Наприклад, якщо я хочу виписати лінійну формулу (математичну, а не R ...), що мені слід ввести для мультиплікативного терміна?
Енцо

Щоб пояснити, що означає хрест, погляньте на розрахунок var3 <- var 1 * var2будівліlm.2 <- lm(response ~ var1 + var2 + var3)
Джеймс Стенлі

1
значить, це просто множинне множення?
Енцо

1
@Enzo, так, хрест буквально два доданків множаться - інтерпретація в значній мірі буде залежати від того , var1і var2обидва безперервно (досить важко інтерпретувати, на мій погляд) , або один з них є , наприклад , двійкова категоричний (. Простіше розглядати) Дивіться цю відповідь для деяких прикладів інтерпретації Пітера Флома
Джеймс Стенлі

Відповіді:


8

Стандартний спосіб написати рівняння прогнозування для вашої моделі:

у^=б0+б1х1+б2х2+б12х1х2

Але зрозуміти взаємодію трохи легше, якщо ми по-різному оцінимо:

у^=(б0+б2х2)+(б1+б12х2)х1

За допомогою цього факторингу ми можемо бачити, що для заданого значення y-перехоплення для дорівнює а нахил на - . Отже, зв’язок між та залежить від .х2х1б0+б2х2х1(б1+б12х2)ух1х2

Ще один спосіб зрозуміти це, побудувавши графіки передбачуваних ліній між і для різних значень (або навпаки). Функції та пакети TeachingDemos для R були розроблені, щоб допомогти з такими типами графіків.ух1х2Predict.PlotTkPredict


3

Припустимо, ви отримаєте бальні оцінки 4 для х1, 2 для х2і 1,5 для взаємодії. Тоді рівняння говорить, що lmпридатність є

у=4х1+2х2+1.5х1х2

Це те, чого ти хотів?


3

Про взаємодію найпростіше думати з точки зору дискретних змінних. Можливо, ви могли вивчити двосторонні ANOVA, де у нас є дві змінні групи (наприклад, стать і вікова категорія, з трьома рівнями для віку) і дивитесь, як вони відносяться до певної безперервної міри (наша залежна змінна, наприклад, IQ).

Термін x1 * x2, якщо він значущий, можна зрозуміти (у цьому тривіальному, складеному прикладі) як IQ, що поводиться по-різному на рівні віку для різних статей. Наприклад, можливо, IQ є стабільним для чоловіків у трьох вікових групах, але молоді жінки починають нижче молодих чоловіків і мають висхідну траєкторію (при цьому старша вікова група має більш високе середнє значення, ніж стара вікова група для чоловіків). У графіку засобів це означатиме горизонтальну лінію для чоловіків у середині графіка, а можливо, 45-градусну лінію для жінок, яка починається нижче чоловіків, але закінчується вище чоловіків.

Суть полягає в тому, що, коли ви рухаєтеся по рівнях однієї змінної (або "утримуючи константу X1"), те, що відбувається в іншій змінній, змінюється. Ця інтерпретація також працює з безперервними змінними прогнозувальника, але не так просто конкретно проілюструвати. У цьому випадку ви можете взяти конкретні значення X1 і X2 і подивитися, що відбувається з Y.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.