Як перевірити, чи коефіцієнт регресії модерується змінною групування?


9

У мене регресія зроблена для двох груп вибірки на основі модерувальної змінної (скажімо, статі). Я роблю простий тест на модеруючий ефект, перевіряючи, чи втрачається значення регресії на одному наборі, а залишається в іншому.

Q1: Вищенаведений метод є дійсним, чи не так?

Q2: рівень довіри мого дослідження встановлений на рівні 95%. Для однієї групи регресія є значною .000. Для іншого це важливо - 0,038. Отже, я вважаю, що я повинен прийняти обидві регресії як такі значні, і що ефекту модерації немає. Прийняття регресії є важливим в той час, як це доведено, що він не знаходиться в 0,01 ранку, я спричиняю помилку типу I (приймаю аргумент помилкового)?

Відповіді:


12

Ваш метод, як видається, не вирішує питання, припускаючи, що "модеруючий ефект" - це зміна одного або декількох коефіцієнтів регресії між двома групами. Тести значущості в регресії оцінюють, чи не є нульовими коефіцієнти. Порівнюючи p-значення у двох регресіях, ви мало знаєте (якщо щось є) про відмінності в цих коефіцієнтах між двома вибірками.

Натомість введіть гендер як фіктивну змінну та взаємодійте її з усіма коефіцієнтами інтересу. Потім перевірити на значущість пов'язаних коефіцієнтів.

Наприклад, у найпростішому випадку (однієї незалежної змінної) ваші дані можуть бути виражені у вигляді списку (xi,yi,gi) кортежі де gi - гендери, кодовані як 0 і 1. Модель статі0 є

yi=α0+β0xi+εi

(де i індексує дані, для яких gi=0) та модель для статі 1 є

yi=α1+β1xi+εi

(де i індексує дані, для яких gi=1). Параметри єα0, α1, β0, і β1. Помилки єεi. Припустимо, що вони незалежні і однаково розподілені з нульовими засобами. Комбінована модель для перевірки на різницю укосів (β's) можна записати як

уi=α+β0хi+(β1-β0)(хiгi)+εi

(де i варіюється за всіма даними), тому що при встановленні гi=0 останній термін випадає, даючи першу модель с α=α0, і коли ви встановите гi=1 два кратні хi комбінувати, щоб дати β1, поступаючись другій моделі с α=α1. Тому ви можете перевірити, чи нахили однакові ("ефект помірного моделювання"), встановивши модель

уi=α+βхi+γ(хiгi)+εi

і тестування, чи оцінюється розмір ефекту, що модерує, γ^, дорівнює нулю. Якщо ви не впевнені, що перехоплення будуть однаковими, додайте четвертий термін:

уi=α+δгi+βхi+γ(хiгi)+εi.

Не обов'язково перевіряти, чи є δ^ дорівнює нулю, якщо це не викликає інтересів: воно включене, щоб дозволити окремі лінійні пристосування до обох статей, не змушуючи їх мати однаковий перехоплення.

Основним обмеженням цього підходу є припущення про те , що дисперсії помилокεiоднакові для обох статей. Якщо ні, то вам потрібно включити таку можливість, і це потребує трохи більше роботи з програмним забезпеченням, щоб відповідати моделі та більш глибоко замислюватися над тим, як перевірити значення коефіцієнтів.


Дякую, я можу зрозуміти, як це працює. Чи працює цей метод, якщо у мене є кілька модеруючих змінних? Скажіть, наприклад, регіон (сільський / міський), рівень освіти (середня освіта / ні)? Чи можу я додати додаткові фіктивні змінні та перевірити ефект?
скорпіон

1
@whuber, я час від часу стикаюся з функціонально схожими ситуаціями, коли аналітик просто розбиває вибірку на дві групи, використовує однаковий набір незалежних змінних для обох груп і просто якісно порівнює коефіцієнти. Чи є якісь переваги тієї ситуації, яку я щойно описав над цією формулюванням використання ефектів взаємодії?
Andy W

3
@Andy Без будь-якого наміру звучати критично чи зневажливо, єдиною перевагою, яку я можу придумати для якісного методу, є те, що він не вимагає розуміння чи компетенції аналітика: це робить його доступним для більшої кількості людей. Якісний підхід загрожує труднощами. Наприклад, можуть бути великі видимі відмінності як між схилами, так і з перехопленнями випадково. Якісна оцінка справедливих коефіцієнтів не зможе відрізнити цю ситуацію від реального впливу.
whuber

1
@whuber, моя початкова думка була однаковою, і я нещодавно дав таку ж пропозицію колезі, який проігнорував пропозицію заради простоти (як ви нагадали). Я подумав, що, можливо, коментар про припущення, що відхилення помилок є однаковими для обох статей, може зробити два модельні підходи більш доречними, враховуючи, що припущення порушено.
Andy W

1
@Andy Так, але можливість різних дисперсій не підвищує значення неякісного порівняння. Швидше, це вимагатиме більш нюансованого кількісного порівняння оцінок параметрів. Наприклад, як грубе (але інформативне) наближення можна виконати варіант тесту CABF або Satterthwaite на основі оцінених відхилень помилок та їх ступеня свободи. Навіть візуальне обстеження добре сконструйованого розсіювача було б легко зробити і набагато більш інформативним, ніж просто порівняння коефіцієнтів регресії.
whuber

-1

Я думаю, що модерування змінної угруповання буде однаково добре працювати при порівнянні коефіцієнтів регресії в незалежних хвилях даних поперечного перерізу (наприклад, рік1, рік2 та рік3 як група1 група2 та група3)?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.