Регресія на не повинна бути причинною, якщо є опущені змінні, які впливають і на і на . Але якщо не для опущених змінних та помилки вимірювання, чи є причиною регресії? Тобто, якщо в регресію включена кожна можлива змінна?
Регресія на не повинна бути причинною, якщо є опущені змінні, які впливають і на і на . Але якщо не для опущених змінних та помилки вимірювання, чи є причиною регресії? Тобто, якщо в регресію включена кожна можлива змінна?
Відповіді:
Ні, це не так, я покажу вам кілька зустрічних прикладів.
Перша - зворотна причинно-наслідкова зв’язок . Розглянемо причинно-наслідкову модель , де і є стандартними гауссовими випадковими змінними. Тоді , так не викликає , а буде залежати від .
Другий приклад - керування колайдерами (див. Тут ). Розглянемо причинно-наслідкову модель , тобто не викликає а є загальною причиною. Але зауважте, що якщо ви запускаєте регресію, включаючи , коефіцієнт регресії не буде нульовим, тому що кондиціонування за загальною причиною спричинить асоціацію між і (можливо, ви хочете побачити тут також Аналіз шляху в присутності кондиціонер ).
Більш загально, регресія на буде причинною, якщо змінні, включені в регресію, задовольняють критерію зворотного доступу .
Окрім важливої відповіді Карлоса Сінеллі на це питання, є ще кілька причин того, що коефіцієнти регресії можуть бути непричинними.
По-перше, неправильне визначення моделі може призвести до того, що параметри не є причинними. Тільки тому, що у вас є всі відповідні змінні у вашій моделі, це не означає, що ви правильно їх налаштували. Як дуже простий приклад, розглянемо змінну , розподілену симетрично навколо 0. Припустимо, що на вашу змінну результату впливає таким чином, що . Регресію на (на відміну від ) тоді дасть розрахунковий коефіцієнт для близько 0, явно упередженим, незважаючи на ви налагодивши для всіх (єдиною) змінної , яка впливає .
По-друге, і пов'язано з темою зворотної причинності, є також ризик виникнення упередженості селекції , тобто вибірки вибрано таким чином, що вона не є репрезентативною для населення, до якого ви хочете зробити свій висновок. Крім того, відсутні дані також можуть ввести зміщення, якщо дані не пропущені повністю випадково.