Чи означає причинно-наслідковий зв’язок кореляцію?


118

Кореляція не означає причинно-наслідкового зв’язку, оскільки може бути багато пояснень кореляції. Але чи означає причинно-наслідковий зв’язок кореляцію? Інтуїтивно я думаю, що наявність причинно-наслідкових зв’язків означає, що обов'язково існує певна кореляція. Але моя інтуїція не завжди добре допомагала мені в статистиці. Чи означає причинно-наслідковий зв’язок кореляцію?


5
Проблема полягає в тому, що якщо ви подивитесь на "імплікацію" у словнику, ви побачите і "запропонувати", і "потрібно".
rolando2

6
Кореляція не означає причинного зв'язку, але вона махає бровами сугестивно і жестоко жестикулює, обмацуючи «погляд туди». xkcd.com/552
jchristie

1
Здається, саме запитання не шукає конкретної фактичної відповіді, на що вказує використання цього слова. Посилання вище, можливо, як кінцева, можливо. Або більше, напевно, але я не можу цього довести.
jchristie

Відповіді:


96

Як було сказано у багатьох відповідях вище, причинно-наслідкова зв’язок не передбачає лінійної кореляції . Оскільки багато кореляційних понять походять із полів, які сильно покладаються на лінійну статистику, зазвичай кореляція розглядається як рівна лінійній кореляції. Стаття у Вікіпедії - це добре джерело для цього, мені дуже подобається це зображення:

Приклади кореляції

Подивіться на деякі фігури в нижньому ряду, наприклад форму параболи-іш у четвертому прикладі. Це щось на зразок відповіді @StasK (з трохи шуму додано). Y може бути повністю викликаний X, але якщо числова залежність не є лінійною та симетричною, у вас все ще буде кореляція 0.

Слово, яке ви шукаєте, - це взаємна інформація : це свого роду загальна нелінійна версія кореляції. У цьому випадку ваше твердження було б істинним: причинно-наслідкова зв’язок передбачає високу взаємну інформацію .


3
Зазвичай причинно-наслідковий зв’язок супроводжує високу взаємну інформацію. Дивіться відповідь @ gung, де "якщо причина ідеально співвідноситься з іншою причинною змінною з точно протилежним ефектом".
Ніл G

5
Довід двох причин з протилежними ефектами , які скасовують один одного не має сенсу для мене , як справи . Я завжди можу припустити, що єдинороги щось спричиняють, і гремліни прекрасно відміняють зусилля; Я уникаю цього, оскільки це нерозумно. Але, можливо, я неправильно розумію вашу думку.
Артем Казнатчеєв

11
Його приклад є більш екстремальним, ніж це має бути. Ви можете мати булеві змінні і такі, що і є причинами , а (mod 2). Тоді, відсутні знання , і не мають взаємної інформації. - це нерозкритий прихильник - те, що ви називаєте "gremlins", навіть якщо це щось дуже поширене. C A B C C = A + B B A C BA,BCABCC=A+BBACB
Ніл Г

2
@NielG Я погоджуюся з вашим першим реченням, але не другим. Тільки тому, що A & B викликає C, не означає, що A викликає C і B викликає C. Я не розумію, чому причина повинна бути розподільною над &.
Артем Казнатчеєв

4
Причина того, що A все-таки є причиною C, полягає в тому, що зміна A все одно зміниться C. Отже, C залежить від A навіть тоді, коли ми не спостерігаємо B.
Neil G

41

Сувора відповідь - «ні, причинно-наслідкова зв’язок не обов'язково означає кореляцію».

Розглянемо і . Причинність не стає сильнішою: визначає . Тим не менш, кореляція між і дорівнює 0. Доведення: (спільними) моментами цих змінних є: ; ; за допомогою властивість стандартного нормального розподілу в тому, що його непарні моменти всі дорівнюють нулю (можна сказати, легко, наприклад, від його функції, що генерує момент). Отже, кореляція дорівнює нулю.XN(0,1)Y=X2χ12XYXYE[X]=0E[Y]=E[X2]=1

Cov[X,Y]=E[(X0)(Y1)]=E[XY]E[X]1=E[X3]E[X]=0

Щоб вирішити деякі коментарі: єдина причина цього аргументу полягає в тому, що розподіл зосереджено на нулі, а симетричний близько 0. Насправді, будь-який інший розподіл із цими властивостями, який мав би достатню кількість моментів, працював би в місце , наприклад, рівномірне на або Лаплас . Спрощений аргумент полягає в тому, що для кожного позитивного значення існує однаково ймовірне від'ємне значення однакової величини, тому, коли ви квадратуєте , ви не можете сказати, що більші значення пов'язані з більшими або меншими значеннями зXN(0,1)(10,10)exp(|x|)XXXXY. Однак якщо взяти, скажімо, , то , , і . Це має сенс: для кожного значення нижче нуля, є набагато більш ймовірне значення , яка знаходиться вище нуля, так що великі значення пов'язані з великими значеннями . (Останнє має нецентральних розподілу , ви можете витягнути відхилення від сторінки Вікіпедії і обчислити кореляцію , якщо ви зацікавлені.)XN(3,1)E[X]=3E[Y]=E[X2]=10E[X3]=36X - X X Y χ 2Cov[X,Y]=E[XY]E[X]E[Y]=3630=60XXXYχ2


2
@DQdlM: Стандартна випадкова величина випадає з непарних центральних моментів , завдяки рівності густини. Метью: Відповідь "ні", як показав Стаск, тому що кореляція - не єдиний тип залежності.
Емре

3
@DQdlM: див. Нижній середній графік на першому зображенні на сторінці співвідношення Вікіпедії . Це справа Стаска. Він працює лише тоді, коли х однаково розподілено щодо походження (тобто, якщо , кореляція буде досить високою)XN(3,1)
naught101

3
PS Я так радий, що ви опублікували цю відповідь. Важко було повірити, що питання без такої відповіді пройшло так довго. Це був саме той приклад, який мені прийшов у голову, коли я побачив це питання, але не встиг написати його. Я радий, що ти знайшов час. Ура.
кардинал

3
@cardinal: так, я думаю, що ми всі навчилися таких простих контрприкладів у школі ... і так, для виведення коваріації вам потрібні лише перший і третій моменти, які дорівнюють нулю. Якщо у вас є нетривіальний приклад асиметричного розподілу, який має нульовий третій момент (тонко налаштовані маси ймовірностей, що перевищують п’ять-шість балів, не враховуються), мені було б дуже цікаво побачити це.
Стаск

3
Тут «причинність» вважається вираженою як функція. Це означає, що викликає тоді і тільки тоді, коли існує вимірювана функція, така, що . Я думаю, ми могли б провести решту життя, обговорюючи обґрунтованість цього аргументу. Y f Y = f ( X )XYfY=f(X)

31

По суті, так.

Кореляція не означає причинно-наслідкового зв’язку, оскільки можуть бути інші пояснення кореляції поза причиною. Але для того, щоб А була причиною В, вони повинні бути певним чином пов'язані . Це означає, що між ними існує кореляція - хоча ця кореляція не обов'язково повинна бути лінійною.

Як вважають деякі з коментаторів, скоріше за все доцільніше використовувати такий термін, як "залежність" чи "асоціація", а не кореляція. Хоча як я вже згадував у коментарях, я бачив, що "кореляція не означає причинно-наслідкового зв'язку" у відповідь на аналіз, що виходить далеко за просту лінійну кореляцію, і тому для цілей приказки я по суті поширив "кореляцію" на будь-яку асоціація між A і B.


16
Я схильний резервувати словосполучення для лінійної кореляції і використовую залежність для нелінійних співвідношень, які можуть мати або не мати лінійну кореляцію.
Пам’ятка

4
@ Memming Я також врятував би те, що люди вистрілюють "Кореляція не передбачає причинно-наслідкового зв'язку" відносно: досить складна нелінійна асоціація.
Фоміт

Спогад правильний. Вам потрібно визначити кореляцію, якщо ви не маєте на увазі кореляцію Пірсона.
Ніл Г

1
@NeilG Або з цього питання, можливо, вдасться отримати лінійну кореляцію Пірсона шляхом перетворення однієї змінної чи іншої. Проблема в тому, що сама приказка надмірно спрощена.
Фоміт

1
@EpiGrad: І хороші моменти. За загальною думкою, кореляція просто більше A збігається з більшою кількістю B. Я думаю, що ваша відповідь отримала б користь від того, щоб зрозуміти ваше використання широкого визначення кореляції.
Ніл G

23

Додавання до відповіді @EpiGrad. Думаю, для багатьох людей "кореляція" буде означати "лінійну кореляцію". І концепція нелінійної кореляції може бути не інтуїтивно зрозумілою.

Отже, я б сказав: "ні, вони не повинні мати взаємозв'язок, але вони мають бути пов'язані ". Ми погоджуємось щодо речовини, але не погоджуємось щодо найкращого способу передачі речовини.

Одним із прикладів такої причинної причинності (принаймні, люди вважають, що це причинно) - між вірогідністю відповіді на ваш телефон та доходом. Відомо, що люди з обох кінців спектру доходів рідше відповідають на телефони, ніж люди в середині. Вважається, що причинно-наслідковий характер відрізняється у бідних (наприклад, уникайте інкасаторів) та багатих (наприклад, уникайте людей, які просять пожертви).


21

XY

Розглянемо таку причинно-наслідкову модель:

XYU

XUY

Тепер нехай:

Xbernoulli(0.5)Ubernoulli(0.5)Y=1XU+2XU

UP(Y|X)=P(Y)XYYX

XUYXUXYUY {X,U}YXYXYXYXYU

Отже, коротко кажу, що: (i) причинність припускає залежність; але, (ii) залежність є функціональною / структурною залежністю, і вона може перетворюватися на конкретну статистичну залежність, про яку ви думаєте.


Карлос, правильно сказати, що якщо ми знаємо повний набір змінних, що беруть участь у причинно-наслідковій моделі, ця проблема (статистична невидимість) зникає?
markowitz

@markowitz вам потрібно буде дотримуватися всього до детермінованого рівня, таким чином, не дуже реалістичний сценарій.
Карлос Сінеллі

Я тлумачу вашу відповідь як «так». Ви маєте рацію, ситуація, яку я вважав, є нереальною; Я про це знаю. Однак питання стосувалося лише логіки, яку ви описали, і остаточності було зрозуміти її. Моє переконання було щось на кшталт "причинно-наслідкова зв’язок означає статистичну асоціацію", і інші відповіді на цій сторінці звучать приблизно так. Зрештою, ваш приклад є незначним нереальним, але не з цієї причини нецікавим. Мені здається, що в цілому причинно-наслідкова зв’язок без статистичної асоціації є дещо нереальною, але теоретично цікавою.
markowitz

1
@markowitz "статистична невидимість" буває тоді, коли модель не вірна графіку. Для точного скасування це залежить від конкретного вибору параметризації, тому деякі люди стверджують, що це дійсно малоймовірно. Однак близьке скасування може бути правдоподібним, оскільки це залежить від сусідства параметрів, тому все залежить від контексту. Сенс у тому, що ви повинні зробити свої причинно-наслідкові припущення явними, оскільки, логічно, причинно-наслідкова зв'язок не передбачає асоціації сама по собі - вам потрібні додаткові припущення.
Карлос Сінеллі

13

Причина та ефект буде корелювати , якщо немає якихось - яких змін взагалі в частоті і величиною причини і без зміни взагалі в причинному сили. Єдиною іншою можливістю було б, якщо причина ідеально співвідноситься з іншою причинною змінною з точно протилежним ефектом. В основному це умови думки-експерименту. У реальному світі причинно-наслідкова зв’язок означатиме залежність у якійсь формі (хоча це може бути не лінійною кореляцією).


3
@NeilG, я відмовився від своєї залежності від курсиву .
gung

1
Деякі теорії насправді це мають на увазі, наприклад, багато моделей теорії ігор. Деякі емпіричні ситуації, коли ви не можете розрізнити різницю (хоча насправді існує така «в гунгалі» :-) включайте «нейтральні» сценарії зміни гена, коли тиск еволюційного відбору на двох рівнях вказує в різні боки.
кон'югатприор

1
Мені подобається перший виняток, але не другий виняток. Мені подобається думати, що перемикання перемикача призводить до вимкнення світла, але якщо мені трапляється лише перемикач під час затемнення, нічого не відбувається. Можливо, насправді не було причинного зв'язку.
emory

1
@ naught101, ви піднімаєте хорошу точку, про яку вже йшлося в інших місцях на цій сторінці. Я відредагував свою відповідь. Однак, коли я працював з людьми, я не думаю, що вони мають чітке уявлення про кореляцію як обов'язково лінійну, хоча я їм про це кажу. Хоча вони не ставлять це в цих термінах, я думаю, що більшість людей розуміють "кореляцію" як ближчу до "функції". Тим не менш, я повинен бути чіткішим у використанні термінів, і мав би бути з самого початку.
gung

2
@emory: причиною загоряння світла є власне закриття електричного кола (що викликається мерехтінням вимикача, з умовами навколишнього середовища, включаючи функціонуючу мережу). Під час затемнення натискання на перемикач не закриває ланцюг, оскільки воно порушено в іншому місці. Тож у певному сенсі затемнення - це "протилежний" ефект, про який Гунг говорив (тобто світло увімкнено, затемнення вимикає його). Це також можна вважати зворотним ефектом.
naught101

2

Тут є чудові відповіді. Артем Казнатчеєв , Фоміт та Петро Флом зазначають, що причинно-наслідкова зв'язок зазвичай передбачає залежність, а не лінійну кореляцію. Карлос Сінеллі наводить приклад, коли немає залежності через те, як налаштована функція генерації.

Я хочу додати пункт про те, як ця залежність може зникнути на практиці, у видах наборів даних, з якими ви могли б працювати. Ситуації, такі як приклад Карлоса, не обмежуються лише «умовами думки-експерименту».

Залежності зникають у саморегулюючих процесах . Наприклад, гомеостаз гарантує, що ваша внутрішня температура тіла залишається незалежною від кімнатної температури. Зовнішнє тепло безпосередньо впливає на температуру тіла, але воно також впливає на охолоджувальні системи (наприклад, пітливість), які підтримують стабільність температури тіла. Якщо ми відбираємо температуру в надзвичайно швидкі інтервали та використовуємо надзвичайно точні вимірювання, ми маємо шанс спостерігати причинно-наслідкові залежності, але при нормальних швидкостях відбору проб температура тіла та зовнішня температура виявляються незалежними.

Процеси саморегуляції поширені в біологічних системах; вони виробляються еволюцією. Ссавці, які не регулюють свою температуру тіла, видаляються природним відбором. Дослідники, які працюють з біологічними даними, повинні усвідомлювати, що причинно-наслідкові залежності можуть зникнути в їх наборах даних.


-3

Не було б причиною без кореляції бути Rng?

Якщо, як випливає з прийнятої відповіді, ви не користуєтеся неймовірно обмеженою інтерпретацією слова "кореляція", це дурне запитання - якщо одна річ "викликає" іншу, це за визначенням впливає на неї якимось чином, чи це збільшення чисельності чи просто інтенсивності.

правильно?

Знову ж таки, ви могли б обговорити щось на кшталт: видимість того, що на щось впливає щось інше, що, мабуть, виглядатиме як причинно-наслідковий зв’язок, але насправді ви не вимірюєте те, що думаєте, що вимірюєте ...

Так, так, я думаю, що коротка відповідь буде: "Так, поки ви не можете створити ентропію".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.