Коефіцієнти регресії, які перевертають знак, включаючи інші прогноктори


31

Уявіть собі

  • Ви запускаєте лінійну регресію з чотирма числовими предикторами (IV1, ..., IV4)
  • Коли в якості предиктора включено лише IV1, стандартизованою бета-версією є +.20
  • Якщо ви також включаєте IV2 до IV4, знак стандартизованого коефіцієнта регресії IV1 перевертається до -.25(тобто він стає негативним).

Звідси виникає кілька питань:

  • Що стосується термінології, ви називаєте це "супресорним ефектом"?
  • Які стратегії ви б використали для пояснення та розуміння цього ефекту?
  • Чи є у вас якісь приклади таких ефектів на практиці і як ви пояснили та зрозуміли ці ефекти?

Як би ви пояснили ситуацію, коли коефіцієнти змінюють знаки, включаючи прогнози, але там, безумовно, не задіяна будь-яка мультиколінеарність (як би запропонували низькі значення VIF)? Цікаво, однак, коли, включаючи прогнозів, знак змінився на те, що я спочатку очікував, що це буде (позитивним). Він був негативним у простій одній незалежній змінній регресії (кореляційна матриця показала мінімальну негативну кореляцію із залежною змінною), але миттєво виявився позитивним з іншими включеними прогнозами.

@John Ви можете видалити свій коментар і опублікувати своє запитання як окреме запитання на цьому веб-сайті (тобто, використовуючи "задати питання вгорі". Якщо ви вважаєте, що ваше питання пов'язане з цим питанням, тоді додайте посилання на це запитання в ваше нове запитання
Джеромі Англім

2
Документ, який я написав із Сетом Даттером, може допомогти з’ясувати речі. Він написаний переважно з геометричної точки зору. Ось посилання: arxiv.org/abs/1503.02722 . -Brian Knaeble, B., & Dutter, S. (2015). Повернення оцінок найменших квадратів та оцінка незалежної від моделей напрямків унікальних ефектів. переддрук arXiv arXiv: 1503.02722.

Відповіді:


26

Як зазначав Джофрхлд, мультиколінеарність - звичайний підозрюваний. В основному, якщо ваші змінні позитивно співвідносяться, то коефіцієнти будуть негативно корелювати, що може призвести до неправильного знаку на одному з коефіцієнтів.

Однією з перевірок було б виконати регресію основних компонентів або регресію хребта. Це зменшує розмірність регресійного простору, обробляючи мультиколінеарність. Ви закінчуєте упереджені оцінки, але, можливо, нижчий показник MSE та виправлені знаки. Незалежно від того, йдете ви з цими конкретними результатами чи ні, це хороша діагностична перевірка. Якщо ви все-таки отримаєте зміни знаків, це може бути теоретично цікавим.

ОНОВЛЕННЯ

Виходячи з коментаря у відповіді Джона Крісті, це може бути цікавим. Зворотний зв'язок (величина чи напрямок) - приклади Парадокса Сімпсона, Парадокса лорда та ефектів придушення. Відмінності по суті стосуються типу змінної. Корисніше зрозуміти основне явище, а не думати з точки зору певного «парадокса» чи ефекту. З точки зору причинного зв'язку, поданий нижче документ добре допомагає пояснити, чому я детально процитую їх вступ та висновок, щоб зіпсувати ваш апетит.

Ту та інші представляють аналіз еквівалентності трьох парадоксів, роблячи висновок, що всі три просто повторюють недивовижну зміну асоціації будь-яких двох змінних, коли третя змінна є статистично контрольованою. Я називаю це недивовижним, тому що в умовному аналізі є звичайним перетворення чи зміна величини. Щоб уникнути будь-якого, ми повинні взагалі уникати умовного аналізу. Що стосується парадоксів Сімпсона та Лорда чи ефекту придушення, крім того, що вони вказують на очевидне, що привертає переривчасті та інколи тривожні інтереси, що спостерігаються в літературі?

[...]

На закінчення не можна перебільшувати, що хоча парадокси Сімпсона та пов'язані з цим парадокси виявляють небезпеку використання статистичних критеріїв для керування причинно-наслідковим аналізом, вони не містять ані пояснень явища, яке вони хочуть зобразити, ані покажчиків того, як їх уникнути. Пояснення та рішення лежать у причинному міркуванні, яке спирається на базові знання, а не на статистичні критерії. Давно пора ми припинили лікувати неправильно витлумачені ознаки та симптоми («парадокси») і почали займатися справою із захворюванням («причинність»). Ми повинні справедливо звернути свою увагу на багаторічну проблему відбору коваріату для причинного аналізу з використанням неекспериментальних даних.


1
Дякуємо за пропозицію дослідити регрес хребта чи PCA. Тільки бічна сторона щодо Вашого коментаря "якщо ваші змінні позитивно співвідносяться, то коефіцієнти будуть негативно корельовані, що призводить до зміни сторони знаків": позитивно корельовані прогнози, як правило, не призводять до відміни знаків.
Джеромі Англім

Вибачте, це пояснення в одному рядку, написане поспіхом. Виправлено зараз, дякую.
АРС

Відмінний момент щодо важливості причинних механізмів.
Джеромі Англім

14

Я вважаю, що подібні наслідки часто викликані колінеарністю (див. Це питання ). Я думаю, що книга про багаторівневе моделювання Гельмана та Хілла про це говорить. Проблема полягає в тому, що IV1вона співвідноситься з одним або декількома іншими прогнозами, і коли всі вони включаються в модель, їх оцінка стає неправдивою.

Якщо коефіцієнт згортання пов'язаний з колінеарністю, то повідомляти про це не дуже цікаво, оскільки це пов’язано не з відносинами між вашими прогнозами до результату, а насправді через зв’язок між прогнозами.

Те, що я бачив, запропонував вирішити цю проблему - це резидуалізація. Спочатку ви підходите до моделі IV2 ~ IV1, а потім приймаєте залишки цієї моделі як rIV2. Якщо всі ваші змінні є співвіднесеними, вам слід реально остаточно їх усі. Ви можете вибрати зробити так, як це

rIV2 <- resid(IV2 ~ IV1)
rIV3 <- resid(IV3 ~ IV1 + rIV2)
rIV4 <- resid(IV4 ~ IV1 + rIV2 + rIV3)

Тепер підходимо до кінцевої моделі

DV ~ IV1 + rIV2 + rIV3 + rIV4

Тепер коефіцієнт для rIV2являє собою незалежний ефект IV2заданої його кореляції з IV1. Я чув, що ви не отримаєте однакового результату, якщо ви будете резиденлізовані в іншому порядку, і що вибір порядку резидуалізації - це справді виклик судження в рамках ваших досліджень.


Дякую за відповідь. У мене були ці думки. (а) Мультиколінеарність: я згоден. Без нього коефіцієнти не повинні змінюватися. (б) Чи цікаво? Насправді я думаю, що гортання знаків може мати цікаві теоретичні тлумачення в деяких випадках; але, можливо, не з точки зору чистого передбачення. (c) Резидуалізація: Я б хотів почути, що інші люди думають про такий підхід.
Джеромі Англім

Я не впевнений, чи може бути багатоколірність цікавою. Скажіть, у вас був якийсь результат O, а ваші прогнози є Incomeі Father's Income. Факт, з яким Incomeспіввідносяться, Father's Incomeє суто цікавим, але цей факт був би правдивим незалежно від значення O. Тобто, ви можете встановити, що Oпередбачувачі всі колінеарні, не збираючи ніколи своїх результатів, і навіть не знаючи, який результат! Ці факти не повинні бути особливо цікавішими, як тільки ви знаєте, що Oце насправді Education.
JoFrhwld

Я припускаю, що супресорний ефект може бути теоретично цікавим, що, імовірно, мультиколінеарність дає вихідну точку для пояснення.
Джеромі Англім

5

Дивіться Парадокс Сімпсона . Коротше кажучи, основний ефект, що спостерігається, може змінитись, коли взаємодія додається до моделі. На пов'язаній сторінці більшість прикладів є категоричними, але є фігура вгорі сторінки, яку можна було уявити безперервно. Наприклад, якщо у вас є категоричний і безперервний предиктор, то безперервний предиктор може легко перевернути знак, якщо категоричний доданий, а в межах кожної категорії знак відрізняється, ніж для загальної оцінки.


Влучне зауваження. Усі приклади Парадокса Сімпсона стосуються категоричних змінних. Чи змінна поняття супресора числовим еквівалентом?
Джеромі Англім
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.