Чи колись дійсно включати в модель двосторонню взаємодію без включення основних ефектів? Що робити, якщо ваша гіпотеза стосується лише взаємодії, чи все-таки потрібно включати основні ефекти?
Чи колись дійсно включати в модель двосторонню взаємодію без включення основних ефектів? Що робити, якщо ваша гіпотеза стосується лише взаємодії, чи все-таки потрібно включати основні ефекти?
Відповіді:
На мій досвід, не тільки необхідно мати всі ефекти нижчого порядку в моделі, коли вони підключені до ефектів вищого порядку, але також важливо правильно моделювати (наприклад, дозволяючи бути нелінійними) основні ефекти, які, здавалося б, не пов'язані з фактори взаємодії, що цікавлять. Це тому, що взаємодія між та може бути стійкою для основних ефектів та . Взаємодії іноді здаються необхідними, оскільки вони є колінеарними з опущеними змінними або опущеними нелінійними (наприклад, сплайном) термінами.x 2 x 3 x 4
Ви запитуєте, чи дійсно це колись. Дозвольте навести загальний приклад, роз'яснення якого може запропонувати вам додаткові аналітичні підходи.
Найпростішим прикладом взаємодії є модель з однією залежною змінною та двома незалежними змінними , у виглядіX Y
з випадкова змінна величина, що має нульове очікування, і використовує параметри і . Часто варто перевірити, чи наближає , оскільки алгебраїчно еквівалентний вираз тієї ж моделі єα , β ′ , γ ′ , δ ′ δ ′ β ′ γ ′
(де тощо).
Отже, якщо є причина припустити, що , ми можемо поглинути це в терміні помилки . Це не тільки дає "чисту взаємодію", але й без постійного терміну. Це, в свою чергу, настійно пропонує приймати логарифми. Деяка гетероседастичність у залишках - тобто тенденція до того, що залишки, пов'язані з більшими значеннями будуть більшими за абсолютне значення, ніж середні, - також вказували б у цьому напрямку. Тоді ми б хотіли вивчити альтернативну рецептуруε Z
з iid випадковою помилкою . Крім того, якщо ми очікуємо, що та будуть великими порівняно з , ми б просто запропонували модельβ X γ Y 1
Ця нова модель має лише один параметр замість чотирьох параметрів ( , і т. Д.), За умови квадратичного відношення ( ), що значно спроститься.α β ′ δ ′ = β ′ γ ′
Я не кажу, що це необхідний або навіть єдиний крок, який потрібно зробити, але я припускаю, що подібне алгебраїчне перестановку моделі, як правило, варто враховувати, коли взаємодія сама по собі виявляється істотною.
Деякі чудові способи дослідження моделей взаємодії, особливо лише з двома та трьома незалежними змінними, містяться у розділах 10–13 ЕДА Тукі .
Хоча в підручниках часто зазначається, що ніколи не слід включати взаємодію в модель без відповідних основних ефектів, але, безумовно, є приклади, коли це мало б ідеальний сенс. Наведу найпростіший приклад, який я можу собі уявити.
Припустимо, що суб'єкти, випадково віднесені до двох груп, вимірюються двічі, один раз на початковій лінії (тобто відразу після рандомізації) та один раз після того, як група Т отримала певну терапію, тоді як група C не проводила цього. Тоді модель повторних заходів для цих даних буде включати основний ефект для випадку вимірювання (фіктивна змінна, яка дорівнює 0 для базової лінії та 1 для подальшого спостереження) та термін взаємодії між манекеном групи (0 для C, 1 для T ) і манекен часу.
Потім модель перехоплення оцінює середній бал випробуваних за базовою лінією (незалежно від групи, в якій вони перебувають). Коефіцієнт для фіктивного періоду вимірювання вказує на зміну контрольної групи між базовою лінією та подальшою діяльністю. А коефіцієнт терміну взаємодії вказує, наскільки більша / менша зміна була в групі лікування порівняно з контрольною групою.
Тут не потрібно включати основний ефект для групи, оскільки на початковому рівні групи є еквівалентними за визначенням через рандомізацію.
Можна, звичайно, стверджувати, що основний ефект для групи все ж повинен бути включений, так що, у разі випадкової рандомізації, це виявиться за допомогою аналізу. Однак це еквівалентно тестуванню засобів базової лінії двох груп один проти одного. І є багато людей, які нахмурилися, перевіряючи на базові відмінності у рандомізованих дослідженнях (звичайно, також є багато тих, хто вважає це корисним, але це інше питання).
Причиною збереження основних ефектів у моделі є ідентифікація. Отже, якщо метою є статистичний висновок про кожен із ефектів, вам слід зберегти основні ефекти в моделі. Однак якщо ваша мета моделювання полягає лише в тому, щоб передбачити нові значення, то цілком законно включати лише взаємодію, якщо це покращує точність прогнозування.
це чітко підкреслено у багатьох відповідях, які дали інші, але простий момент полягає в тому, що моделі з терміном продукту, але без ж / б без модератора та прогноктора - це просто різні моделі. З’ясуйте, що означає кожен з даних процесу, який ви моделюєте, і чи є модель без модератора та прогнозованого сенсу більше, якщо врахувати вашу теорію чи гіпотезу. Спостереження про те, що термін продукту є значущим, але лише тоді, коли модератор та передбачувач не включені, нічого не говорить вам (крім, можливо, що ви ловите рибу для "значущості") без пояснення, чому є сенс залишати їх поза .
Можливо, це залежить від того, для чого ви використовуєте свою модель. Але я ніколи не бачив причин не запускати та описувати моделі з основними ефектами, навіть у випадках, коли гіпотеза стосується лише взаємодії.
Я запозичу абзац із книги «Вступ до аналізу виживання за допомогою« Stata » М.Клевеса, Р.Гутьєрреза, У.Гульда, Ю.Марченка під редакцією Stata press, щоб відповісти на ваше запитання.
Зазвичай читається, що ефекти взаємодії повинні бути включені в модель лише тоді, коли відповідні основні ефекти також включені, але немає нічого поганого в тому, що включати ефекти взаємодії самі по собі. [...] Метою дослідника є параметризація того, що може бути правдивим для даних, що розглядають проблему, а не лише за рецептом.
І x, і y будуть співвідносні з xy (якщо ви не вжили конкретних заходів для запобігання цього за допомогою центрування). Таким чином, якщо ви отримаєте істотний ефект взаємодії зі своїм підходом, це, ймовірно, буде одним або декількома основними ефектами, що маскується як взаємодія. Це не дасть чітких, інтерпретованих результатів. Замість цього бажано побачити, наскільки взаємодія може пояснити вище та вище, що роблять основні ефекти, включаючи x , y та (бажано на наступному кроці) xy .
Щодо термінології: так, β 0 називається "постійною". З іншого боку, "часткове" має конкретні значення в регресії, тому я б не використовував цей термін для опису вашої стратегії тут.
Кілька цікавих прикладів, які виникнуть одного разу на блакитному місяці, описані на цій темі .
Я б припустив, що це просто окремий випадок невизначеності моделі. З байєсівської точки зору, ви просто ставитесь до цього точно так само, як ви ставитесь до будь-якого іншого виду невизначеності, будь-яким:
Це саме те, що люди роблять при тестуванні на «значні ефекти», використовуючи t-квантоли замість нормальних квантових. Оскільки у вас є невизначеність щодо "справжнього рівня шуму", ви враховуєте це, використовуючи більш розповсюджений розподіл у тестуванні. Отже, з вашого погляду, «головний ефект» насправді є «параметром неприємності» стосовно питання, яке ви задаєте. Таким чином, ви просто середньо оцінюєте два випадки (або, загалом, для моделей, які ви розглядаєте). Тому я мав би (невиразну) гіпотезу:
І з цього видно, що є "умовним висновком" гіпотези під mth моделлю (зазвичай це все, що вважається, для обраної "найкращої" моделі) ). Зауважте, що цей стандартний аналіз виправданий, коли - "очевидно найкраща" модель - або коли - всі моделі дають однакові / подібні висновки. Однак якщо жодне з них не дотримано, то теорема Байєса говорить, що найкраща процедура - це середня оцінка результатів, розміщення більшої ваги на моделях, які найбільше підтримуються даними та попередньою інформацією.P ( M m | D I ) ≈ 1 P ( H i n t | D M j I ) ≈ P ( H i n t | D M k I )
Дуже рідко є доброю ідеєю включати термін взаємодії без основних наслідків, що в ньому беруть участь. Девід Ріндскопф із CCNY написав деякі документи про ті рідкісні випадки.
У природі існують різні процеси, які передбачають лише вплив взаємодії та закони, що їх декретують. Наприклад, закон Ома. У психології у вас є, наприклад, модель продуктивності Vroom (1964): Продуктивність = Здатність x Мотивація. Тепер ви можете очікувати значного ефекту взаємодії, коли цей закон справдиться. На жаль, це не так. Ви можете легко виявити два основні ефекти та незначний ефект взаємодії (для демонстрації та подальшого пояснення див. Landsheer, van den Wittenboer and Maassen (2006), Social Science Research 35, 274-294). Лінійна модель не дуже підходить для виявлення ефектів взаємодії; Ом, можливо, ніколи не знайшов би свого закону, коли використовував лінійні моделі.
В результаті інтерпретувати ефекти взаємодії в лінійних моделях важко. Якщо у вас є теорія, яка передбачає ефект взаємодії, ви повинні включати її навіть у незначних випадках. Можливо, ви захочете ігнорувати основні ефекти, якщо ваша теорія виключає ці, але вам це буде важко, оскільки значні основні ефекти часто виявляються у випадку справжнього механізму генерування даних, який має лише мультиплікативний ефект.
Моя відповідь: Так, можна включити в модель двосторонню взаємодію без включення основних ефектів. Лінійні моделі є чудовим інструментом для наближення результатів великої різноманітності механізмів генерування даних, проте їх формули не можуть бути легко інтерпретовані як коректний опис механізму генерації даних.
Цей складний і трапився зі мною в останньому проекті. Я б пояснив це так: скажімо, у вас були змінні A і B, які вийшли значущими незалежно, і з ділового сенсу ви вважали, що взаємодія A і B здається гарною. Ви включили взаємодію, яка виявилася важливою, але B втратила своє значення. Ви б пояснили свою модель спочатку, показавши два результати. Результати показали б, що B спочатку був значущим, але, побачивши його у світлі A, він втратив блиск. Тож B - хороша змінна, але лише тоді, коли її бачать у світлі різних рівнів A (якщо A - категоріальна змінна). Начебто Обама є хорошим лідером, коли його бачать у світлі своєї армії SEAL. Отже печатка Обами * буде суттєвою змінною. Але Обама, коли її бачать один, може бути не так важливим. (Без образи Обамі, лише приклад.)
F = m * a, сила дорівнює масі в рази прискорення.
Він не представлений як F = m + a + ma, або якась інша лінійна комбінація цих параметрів. Дійсно, лише взаємодія між масою та прискоренням мало б сенс фізично.
Чи вірно включати двосторонню взаємодію без головного ефекту?
Так, це може бути дійсним і навіть необхідним. Якщо, наприклад, у 2. Ви б включили коефіцієнт основного ефекту (середня різниця стану синього проти червоного), це погіршило б модель.
Що робити, якщо ваша гіпотеза стосується лише взаємодії, чи все-таки потрібно включати основні ефекти?
Ваша гіпотеза може бути правдивою незалежно від того, чи є головний ефект. Але модель може знадобитися для найкращого опису основного процесу. Так що так, слід спробувати і без, і без.
Примітка: Вам потрібно відцентрувати код на "безперервну" незалежну змінну (вимірювання у прикладі). Інакше коефіцієнти взаємодії в моделі не будуть симетрично розподілені (в прикладі немає коефіцієнта для першого вимірювання).
Якщо змінні, про які йдеться, категоричні, то включення взаємодій без основних ефектів - це лише перематеризація моделі, а вибір параметризації залежить від того, що ви намагаєтеся виконати зі своєю моделлю. Взаємодія безперервних змінних з іншими безперервними змінними або з категоричними змінними - це зовсім інша історія. Дивіться: дивіться цю інформацію від Інституту цифрових досліджень та освіти UCLA
Так, це може бути дійсним, хоча це рідко. Але в цьому випадку вам все-таки потрібно моделювати основні ефекти, які згодом ви регресуєте.
Дійсно, в деяких моделях цікава лише взаємодія, наприклад, тестування на наркотики / клінічні моделі. Це, наприклад, основа моделі узагальнених психофізіологічних взаємодій (gPPI): y = ax + bxh + ch
де x/y
знаходяться вокселі / області, що цікавлять, і h
блок / події дизайну.
У цій моделі обидва a
і c
будуть регресувати, b
зберігатимуться лише для висновку (бета-коефіцієнти). Дійсно, обидва a
і c
представляють помилкову діяльність у нашому випадку, і лише b
представляє те, що не можна пояснити помилковою діяльністю, взаємодією із завданням.
Коротка відповідь: Якщо ви включите взаємодію до фіксованих ефектів, то основні ефекти автоматично включаються, незалежно від того, включите ви їх у свій код чи ні . Єдина відмінність - це ваша параметризація, тобто те, що означають параметри у вашій моделі (наприклад, вони означають групування чи вони відрізняються від еталонних рівнів).
Припущення: я припускаю, що ми працюємо в загальній лінійній моделі і запитуємо, коли ми можемо використовувати специфікацію фіксованих ефектів замість , де і є (категоричними) факторами.
Математичне уточнення: припускаємо, що вектор відповіді . Якщо , і є матрицями проектування трьох факторів, то модель з "основними ефектами та взаємодією" відповідає обмеженню прольоті . Модель з "лише взаємодією" відповідає обмеженню span . Однак проліт span . Отже, це дві різні параметризації однієї і тієї ж моделіX A X B X A B ξ ∈ { X A , X B , X A B } ξ ∈ { X A B } { X A B } = { X A , X B , X A B } (або те саме сімейство розповсюджень, якщо вам зручніше з цією термінологією).
Я щойно бачив, що Девід Бід дав дуже подібну відповідь (вибачення), але подумав, що залишу це тим, хто добре реагує на лінійну перспективу алгебри.