Чи є різниця між "контролем за" та "ігноруванням" інших змінних при множинній регресії?


50

Коефіцієнт пояснювальної змінної у множинній регресії говорить нам про зв'язок цієї пояснювальної змінної із залежною змінною. Все це, одночасно "контролюючи" інші пояснювальні змінні.

Як я бачив це досі:

Хоча кожен коефіцієнт розраховується, інші змінні не враховуються, тому я вважаю їх ігнорованими.

Тож я маю рацію, коли думаю, що терміни «контрольований» та «ігнорований» можна вживати взаємозамінно?


2
Я не був настільки захоплений цим питанням, поки не побачив двох людей, які ви надихнули @gung запропонувати.
DWin

1
Вам не було відомо про розмову, яку ми провели в іншому місці, що мотивувало це питання, @DWin. Це було занадто багато, щоб намагатися пояснити це в коментарі, тому я попросив ОП поставити це на формальне запитання. Насправді я думаю, що явне виявлення відмінності b / t ігнорування та контролю за іншими змінними в регресії є великим питанням, і я радий, що тут це обговорили.
gung - Відновіть Моніку

2
дивіться також першу діаграму тут
Glen_b

1
Чи є дані, використані в цьому запитанні, щоб ми могли самі їх використовувати як навчальний зразок.
Ларрі

Відповіді:


88

YX1X2YX1

  1. X1YX2
    Y=β0+β1X1+β2X2
  2. X1Y X2

    Y=β0+β1X1

X1Yβ^1X1X2

введіть тут опис зображення

X1X2X2X2 X2X2X2=1X2=2X2=3X1YX2 X2

введіть тут опис зображення

Ще один спосіб подумати про відмінність між ігноруванням та контролем іншої змінної - це розглянути відмінність між граничним розподілом та умовним розподілом . Розглянемо цю цифру:

введіть тут опис зображення

( Це взято з моєї відповіді тут: яка інтуїція за умовними розподілами Гаусса? )

YYXYX1=25X1=45X1


2
Гунґ, це просвітливо, я радий, що помилився, використовуючи слово «ігноруй» у своїй відповіді на це запитання. Зараз я спробую з'ясувати, як саме статистичні пакети "контролюють" інші змінні. (Моя перша думка полягає в тому, що вони використовують такий показник, як коефіцієнт кореляції груші. Однак, маючи багато пояснювальних змінних, все може заплутатися) Дякую за цю відповідь!
Сіддхарт Гопі

1
Ласкаво просимо, @garciaj, хоча я ще не закінчив ;-). Я шукаю іншу фігуру; Можливо, доведеться зробити це з нуля.
gung - Відновіть Моніку

4
Найважливішою ідеєю на першій фігурі є те, що ці точки лежать у тривимірному просторі, без червоних кіл на плоскій площині на екрані комп’ютера, сині трикутники на паралельній площині трохи перед екраном та зелений плюси на площині трохи перед цим. Площина регресії нахиляється вниз вправо, але нахиляється вгору, коли вона рухається від екрану до вас. Зауважимо, що це явище виникає тому, що X1 та X2 є співвіднесеними, якби вони були некорельованими, розрахункові бети були б однаковими.
gung - Відновіть Моніку

1
І саме така кореляція між прогнозаторами (наприклад, сценарій @gung) - це те, що зазвичай лежить в основі випадку парадоксу Сімпсона . У Всесвіті з більш ніж трьома змінними, розумно пам’ятати, що це може ховати ваші умовиводи (d'oh!).
FairMiles

2
@MSIS, коли ви керуєте змінною в моделі, модель намагається утримувати її постійною (фіксованою) заради оцінки всього іншого в моделі. Однак це лише спроба і може бути випадковою помилкою, тому вона не обов'язково ідентична тому, що ви отримали, якби запустили дослідження з змінною, фізично закріпленою за заданим значенням.
gung - Відновити Моніку

8

Їх не ігнорують. Якби їх «ігнорували», вони не були б у моделі. Оцінка пояснює змінної інтересу є умовною від інших змінних. Оцінка формується "в контексті" або "з урахуванням впливу" інших змінних в моделі.


Оцінка, звичайно, залежить від інших змінних. Але ми повинні очищати це, вводячи в модель так званих інших факторів. Однак іноді ці фактори можуть носити категоричний характер і викликати більше проблем, ніж давати правильне рішення.
Subhash C. Davar
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.