Чи передбачає проста лінійна регресія причинного зв'язку?


17

Я знаю, що кореляція не означає причинно-наслідкових зв’язків, а натомість силу та напрямок відносин. Чи передбачає проста лінійна регресія причинного зв'язку? Або для цього необхідний інфекційний (t-тест тощо)?


3
Що ви маєте на увазі під «напрямком»? Ви читали відповіді на подібні запитання stats.stackexchange.com/search?q=causal ? Коротка відповідь - ні!
NRH

3
Жодна з ваших пропозицій не передбачає причинно-наслідкового зв’язку (або напряму).
Генрі

2
Я думаю, що ОП означало "напрямок" у сенсі позитивної та негативної кореляції, а не напряму будь-якої причинно-наслідкової зв'язку між X та Y.
JMS

Відповіді:


19

Швидка відповідь - ні. Ви можете легко придумати непов'язані дані, які при регресуванні пройдуть всілякі статистичні тести. Нижче наводиться стара фотографія з Вікіпедії (яка чомусь нещодавно була видалена), яка використовується для ілюстрації "причинності", керованої даними.

Нам потрібно більше піратів для охолодження планети?

введіть тут опис зображення

Для часових рядів існує термін під назвою "Грейнджерська причинність", який має дуже специфічне значення.

http://en.wikipedia.org/wiki/Granger_causality

Крім цього, "причинність" є в очах глядача.


Я мав на увазі позитивну кореляцію чи негативну за напрямком. Дякую за вашу відповідь та посилання на подібні запитання.
user4572

1
Thats повністю божевільна вісь X у цій картині! (Але гарний приклад!)
Енді Ш

2
Ще ..... Сир, Масло та Вівці в Бангладеш, проти S & P500 (R ^ 2 = 0,99) ...... nerdsonwallstreet.typepad.com/my_weblog/files/… ....
bill_080

5
Цей графік явно застарів. Або це, або є упередженість через відсутність геодезистів для вибірки в Аденській затоці
кардинал

2
Ці дані були до того, як Аль-Гор став піратом.
bill_080

10

У математиці регресії немає нічого явного, що визначає причинно-наслідкові зв'язки, а отже, не потрібно явно інтерпретувати нахил (силу та напрямок), ані значення p (тобто ймовірність того, що відношення було б сильним чи сильнішим, якби відносини були нульовими в популяції) причинно-наслідково.

Зважаючи на це, я б сказав, що регресія має набагато сильнішу конотацію, що кожна визначає явну спрямовану залежність, ніж оцінку кореляції між двома змінними. Під кореляцією ви маєте на увазі р. Пірсона , як правило, він не має явної причинної інтерпретації, оскільки метрика симетрична (тобто ви можете перемикати, яка змінна є X, а яка Y, і ви все одно будете мати ту саму міру). Також розмову "Кореляція не означає причинно-наслідкового зв'язку" Я б підозрював, що настільки добре відомо, що, якщо вказати дві змінні, корелюють припущення, що одна не робить причинного твердження.

Розрахункові ефекти в регресійному аналізі не є симетричними, і тому, обираючи змінну, яка знаходиться в правій та проти лівій сторонах, є неявне твердження на відміну від кореляційного. Я підозрюю, що хтось має намір зробити певну причинно-наслідкову заяву в переважній більшості обставин, коли застосовується регресія (висновок проти прогнозування вбік). Навіть у випадках просто констатації кореляцій, я підозрюю, що люди часто мають на увазі певні цілі причинного висновку. Враховуючи, що деякі обмеження виконуються, кореляція може означати причину !


7

Ні кореляція, ні регресія не можуть вказувати на причинну причину (як це показано у відповіді @ bill_080), але як @Andy W вказує, що регресія часто заснована на явно фіксованій (тобто незалежній) змінній та явній (тобто випадковій) змінній. Ці позначення не підходять при кореляційному аналізі.

Цитувати Сокаль і Рольф, 1969, с. 496

"У регресії ми маємо намір описати залежність змінної Y від незалежної змінної X ... для надання підтримки гіпотезам щодо можливої ​​причинності змін у Y змінами в X ..."

"У співвідношенні ми, навпаки, переймаємось тим, чи є дві змінні взаємозалежні або коваріальні - тобто, змінюються разом. Ми не виражаємо одну як функцію іншої".

Сокаль, Р.Р. та Ф.Й. Рольф, 1969. Біометрія. Фріман і Ко


4

З семантичної точки зору альтернативна мета полягає у формуванні доказів для хорошої прогнозної моделі замість доведення причинного зв'язку. Проста процедура побудови доказів для прогнозованого значення регресійної моделі полягає в тому, щоб розділити свої дані на 2 частини і підходити до регресії з однією частиною даних, а з іншою частиною тестування даних - наскільки вона добре передбачає.

Цікавим є поняття причинності Грейнджера .


2

Якщо ви думаєте , коефіцієнтів

β^=Cov(x,y)Var(x)
α = ˉ у - & beta ; ˉ х ,
α^=y¯β^x¯,

де Var (.) та Cov (.) - оцінки з вибірки (даних).

Отже, самі ці параметри є не що інше, як деякі функції кореляції між x і y. Тим більше, бета - це лише «нормалізований» коефіцієнт кореляції. Отже, теорія причинності більше не передбачає регресії, ніж кореляцію. Причинно-наслідкова регресія - це спеціальна техніка в економетрії, де потрібно покластися, наприклад, на інструментальні змінні, щоб обійти феномени, як заплутаність, що затьмарює причинну інтерпретацію будь-якої конкретної регресійної моделі.

Моя точка: регресія може бути зроблена причинного але НЕ причинний у по замовчуванням.

Докладніше дивіться ці відео: https://www.youtube.com/watch?v=Sqy_b5OSiXw&list=PLwJRxp3blEvaxmHgI2iOzNP6KGLSyd4dz&index=55&t=0s

"Рубінова модель" самого Рубіна: http://www.stat.columbia.edu/~cook/qr33.pdf

Чудовий вступний курс з причинності (хоча регресії ще немає): https://www.coursera.org/learn/crash-course-in-causality


Хороші бали. Ласкаво просимо в CV.
Ніл G

0

Моє розуміння (я початківець причинний зв’язок) таке:

  • Лінійна регресія передбачає причинність, якщо ваші коваріати є з контрольованого експерименту, а ваш експеримент добре ізолює гіпотезований причинний фактор (див. Лінійна регресія та причинність у рандомізованому контрольованому експерименті ).

  • Крім того, (оновлено завдяки коментарям) призводить до багатьох порушень причинності Е(ϵ|Х)0. Зауважте, щоЕ(ϵ|Х)0 означає, що ми не можемо робити причинно-наслідкові висновки, але Е(ϵ|Х)=0 не означає, що ми можемо.

Зауважте, що ми не можемо перевірити, чи є Е(ϵ|Х)=0, і тут є певна кругозість у аргументах.


2
Не могли б ви детальніше розказати, як Е(ϵ|Х)=0має на увазі причину?
Секст

Дивіться це для детальної дискусії stats.stackexchange.com/questions/59588/… , з деякими приємними моментами.
mlstudent

ви можете бути трохи більш прямим. Я не бачу prrof або пояснення, як і чомуЕ(ϵ|Х)=0передбачає причинно-наслідковий зв’язок.
Секст

Я трохи новачок причинності, але, як я розумію, є три основні проблеми у=α+βх+ϵне передбачають причинності. Одне - якщо є якась інша опущена змінна, що викликаєу, інше - якщо є опущена змінна, що викликає х, і нарешті третя - це у може спричинити х. Все призведе до порушень стану екзогенності. Я не маю математики для того, чому саме, але насправді буде це шукати / намагатись отримати.
mlstudent

Простий зустрічний приклад. Коли ви генеруєте даніYN(мкY,σY) і Х|YN(а+бY,σХ) то у вас ще є Е(ϵ|Х)=0(X і Y спільно нормально розподілені).
Секст

-6

Регресія ВИЗНАЧАЄ причинно-наслідковий зв’язок .... якщо немає підстав для причинності в результаті фізичного / інтелектуального / наукового аналізу питання, немає підстав для причинно-наслідкового аналізу та немає регресу. Ось чому FDA та подібні урядові установи завжди проголошують "Це викликає це!" лише для того, щоб позбавити її років і мільярдів доларів шкоди. Прикладами є легіон: кава, шоколад, кофеїн, бекон, яйця тощо.

Ще гірше, коли дві змінні мають цикл зворотного зв'язку. Одне може спричинити інше в одній точці; лише для того, щоб інший викликав той, пізніше. Це завжди відбувається в моїй галузі економіки: саме тому більшість економічних аналізів не варте того, на якому документі надруковано.


6
Це абсолютно неправильно. Регресія просто знаходить залежність між двома множинами чисел. Чи існують ці відносини через прямий причинно-наслідковий зв’язок чи ні - це зовсім інше питання.
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.