Чи є регресія причинною, якщо відсутні опущені змінні?


13

Регресія на не повинна бути причинною, якщо є опущені змінні, які впливають і на і на . Але якщо не для опущених змінних та помилки вимірювання, чи є причиною регресії? Тобто, якщо в регресію включена кожна можлива змінна?yxxy


4
Ні, навіть якщо ви включили кожну змінну у світі, це може бути зворотньою причиною. Наприклад, близькість планети до найближчої зірки можна було б точно передбачити за поверхневою температурою планети, але очевидно, що причинність йде іншим шляхом
gazza89

@ gazza89 - оскільки це ефективно відповідає на питання, ви можете розширити його на відповідь.
jbowman

3
Що таке "пропущені змінні"? Припустимо, у мене в наборі даних є один Y та 4 X. Я підходить до моделі, що включає всі 4 X. Тоді у мене немає пропущених змінних?
користувач158565

Відповіді:


20

Ні, це не так, я покажу вам кілька зустрічних прикладів.

Перша - зворотна причинно-наслідкова зв’язок . Розглянемо причинно-наслідкову модель , де і є стандартними гауссовими випадковими змінними. Тоді , так не викликає , а буде залежати від .YXXYE[Y|do(x)]=0XYE[Y|x]X

Другий приклад - керування колайдерами (див. Тут ). Розглянемо причинно-наслідкову модель , тобто не викликає а є загальною причиною. Але зауважте, що якщо ви запускаєте регресію, включаючи , коефіцієнт регресії не буде нульовим, тому що кондиціонування за загальною причиною спричинить асоціацію між і (можливо, ви хочете побачити тут також Аналіз шляху в присутності кондиціонер ).XZYXYZZXYX

Більш загально, регресія на буде причинною, якщо змінні, включені в регресію, задовольняють критерію зворотного доступу .YX


3
Дуже рекомендую «Книгу Чому» Юдеї Перл. Докладно пояснює те, на що звертається Карлос.
Markos Kashiouris

3
Що означає ? do(x)
naught101

5
@ naught101 це означає, що ви насправді змушуєте X = x, на відміну від пасивного спостереження за X = x, дивіться тут stats.stackexchange.com/questions/211008/dox-operator-meaning/…
Carlos Cinelli

Дякую, але мені не зрозуміло в нотації. Чи означає, що означає викликає і ? Чи слід перевертати стрілки? Z X YXZYZXY
Еша

@Esha Це означає, що і і викликаєy zxyz
Carlos Cinelli

6

Окрім важливої ​​відповіді Карлоса Сінеллі на це питання, є ще кілька причин того, що коефіцієнти регресії можуть бути непричинними.

По-перше, неправильне визначення моделі може призвести до того, що параметри не є причинними. Тільки тому, що у вас є всі відповідні змінні у вашій моделі, це не означає, що ви правильно їх налаштували. Як дуже простий приклад, розглянемо змінну , розподілену симетрично навколо 0. Припустимо, що на вашу змінну результату впливає таким чином, що . Регресію на (на відміну від ) тоді дасть розрахунковий коефіцієнт для близько 0, явно упередженим, незважаючи на ви налагодивши для всіх (єдиною) змінної , яка впливає .XYXE(YX)=X2YXX2XY

По-друге, і пов'язано з темою зворотної причинності, є також ризик виникнення упередженості селекції , тобто вибірки вибрано таким чином, що вона не є репрезентативною для населення, до якого ви хочете зробити свій висновок. Крім того, відсутні дані також можуть ввести зміщення, якщо дані не пропущені повністю випадково.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.