Чи жодна кореляція не означає ніякої причинності?


73

Я знаю, що кореляція не означає причинності, але чи означає відсутність кореляції відсутність причинності?


46
Цитувати Ендрю Гелмана, "Кореляція навіть не передбачає кореляції".
Майк Хантер

9
№ А може бути причиною B, але впливати на нього лише нелінійно.
Ніл Г

3
"Кореляція співвідноситься з причинною причиною. (Тільки не дуже.)"
Адріан

7
Будь ласка, подивіться на цю сторінку щодо контрастності. Якщо причинність не передбачає кореляції, то жодна кореляція не означає ніякої причинності.
EdM

4
Хоча добре почати визначити, що кореляція не передбачає причинного зв’язку, а потім обговорювати деталі, я довго думав, чому виокремлювати кореляцію? Я висунув це на асонанс, і ідея, приваблива для вчителів (і мене), що студенти з певними зусиллями можуть запам'ятати слоган і використовувати його у своєму мисленні. Але правда полягає в тому, що багато в статистиці не передбачає причинного зв'язку. Інакше кажучи, це попередження часто надходить у розділі кореляції чи кореляційній лекції, але воно належить скрізь.
Нік Кокс

Відповіді:


76

чи означає відсутність кореляції відсутність причинності?

Ні. Будь-яка керована система є контрприкладом.

Без причинно-наслідкових зв’язків контроль явно неможливий, але успішний контроль означає - грубо кажучи - те, що якась кількість підтримується постійною, що означає, що вона не буде пов'язана ні з чим, включаючи те, що спричиняє постійність.

Тож у цій ситуації висновок про відсутність причинно-наслідкового зв’язку через відсутність кореляції було б помилкою.

Ось дещо актуальний приклад .


Інтуїтивно зрозумілий спосіб подумати над цим
Repmat

+1, цікаво взяти. Однак, мабуть, випливає, що причинно-наслідкові зв’язки можуть бути при відсутності кореляції будь-якого виду. Це не може бути правдою. Якщо якась подія спричиняє іншу, буде якась "така кореляція", що _констант, про який ви згадали, буде у формі нелінійної кореляції
Аксакал

1
+1 Бюстгальтер ! Коли я побачив назву питання в бічній панелі, я був усім "На це потрібно відповісти з точки зору системи". Ти впорався.
Олексій

Якщо з відсутності співвідношення усуне причинну ситуацію, чи залишиться функціонувати кандидатом на позначення "випадковість"?
ttnphns

1
Не впевнений, що я розумію питання @ ttnphns, але я думаю, що відповідь така: якщо ви зачепите кабель гальма (або від'єднаєте педаль акселератора), то пагорби дійсно почнуть показувати свій причинний вплив на швидкість автомобіля.
кон'югатпріор

30

Ні. Головним чином, оскільки під кореляцією ви, швидше за все, має на увазі лінійну кореляцію . Дві змінні можна співвіднести нелінійно і можуть не відображати лінійної кореляції . Побудувати подібний приклад легко, але я наведу приклад, який ближче до вашого (вужчого) питання.

Подивимося на випадкову змінну та не випадкову функцію , за допомогою якої ми створюємо випадкову змінну . Остання явно викликана колишньою змінною, а не просто співвіднесеною. Давайте намалюємо графік розкидання:xf(x)=x2y=f(x)

введіть тут опис зображення

Приємна, чітка нелінійна кореляційна картина, але в цьому випадку це також пряма причинність. Однак коефіцієнт лінійної кореляції є незначним, тобто немає лінійної кореляції, незважаючи на очевидну нелінійну кореляцію і навіть причинність:

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

ОНОВЛЕННЯ: @Kodiologist має рацію в коментарі. Математично можна показати, що коефіцієнт лінійної кореляції для цих двох змінних дійсно дорівнює нулю. У моєму прикладі є стандартною звичайною змінною, тому у нас є таке: Отже, коваріація (а згодом кореляція) дорівнює нулю: x

E[x]=0
E[x2]=1
E[xx2]=E[x3]=0
Cov[x,x2]=E[xx2]E[x]E[x2]=0

Ми отримали однаковий результат для будь-якого симетричного розподілу, наприклад, рівномірного .U[1,1]


8
Несуттєвість не передбачає істинності нульової гіпотези. У вашому прикладі важливо, щоб коефіцієнт кореляції населення
дорівнював

1
Чому ви вважаєте, що ОП означає лінійну кореляцію?
іммібіс

@immibis, оскільки причинно-наслідкова зв’язок повинна спричинити за собою якусь нелінійну кореляцію.
Аксакал

Чому дорівнює нуль кореляції? Коваріація - , і взагалі для випадкової величини тоді . Це справедливо для стандарту, звичайноE[X3]E[X2]E[X]XE[X3]E[X2]E[X]X
Ant

@Ant, я використовую стандартний нормальний для у прикладі MATLAB. Я оновив свою публікацію, щоб було зрозуміло. Дякуємо, що вказали на це. x
Аксакал

18

Ні . Зокрема, випадкові величини можуть бути залежними, але некорельованими.

Ось приклад. Припустимо, у мене є машина, яка приймає один вхід і видає випадкове число , яке дорівнює або або з однаковою ймовірністю. Ясно викликає . Тепер нехай - випадкова величина, рівномірно розподілена на і виберіть з , індукуючи спільний розподіл на . і залежні, оскількиx[1,1]YxxxYX[1,1]Yx=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

Однак співвідношення і дорівнює 0, оскількиXY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]E[X]E[Y]σXσY=000σXσY=0.

1
Власне, це поганий приклад, на мою думку. X не викликає Y. Бінарна змінна, відсутня в моделі PresenceOfX, є фактичною причиною з співвідношенням 1. Те, що ви
докажете,

6
Я дійсно в розгубленості , як ви могли б відчувати , що вибір не викликає . Можливо, вам слід вказати, що ви маєте на увазі під "причиною". xY
Кодіолог

5
@ User2088176 Ось короткий доказ того, що вибір викликає . Давайте використовувати контрафактної модель причинно - наслідкового зв'язку, в якій є індексом в набір можливих розподілів для . Якщо , то є або з однаковою ймовірністю. Якщо , то є або з однаковою ймовірністю. Оскільки контрфакти, що відрізняються значенням означають різні розподіли для , вибір викликаєxYxYx=12Y1212x=34Y -334 xYxY34xYxY .
Кодіолог

1
Цей приклад, можливо, буде простішим (і все ще працює), якщо обмежимо на . [ 0 , 1 ]x[0,1]
JiK

3
Що про простий і стандартний приклад: і . Вони корельовані , але -distributed абсолютно залежить від . X 2 χ 2 ( 1 ) X 2 XXN(0,1)X2χ2(1)X2X
Теркель

14

Можливо, погляд на це з обчислювальної точки зору допоможе.

В якості конкретного прикладу візьмемо генератор псевдовипадкових чисел.

Чи існує причинно-наслідковий зв’язок між заданим вами насінням та виходом з генератора?kth

Чи є яка-небудь вимірювана кореляція?


7

Краща відповідь на питання полягає в тому, що кореляція - це статистична, математична та / або фізична залежність, а причинно-наслідкова зв’язок - метафізична залежність. Ви не можете ЛОГІЧНО пройти шлях від кореляції (або некореляції) до причинного зв'язку, без (великого) набору припущень, що зв'язують метафізику з фізикою. (Один із прикладів - те, що двоє людей можуть погодитися бути "раціональним спостерігачем", є значною мірою довільним і, ймовірно, неоднозначним). Якщо A платить B, щоб робити C, що призводить до D, то в чому причина D? Просто немає раціональної причини вибирати C, B або A (або будь-яку з попередників подій A). Теорія управління стосується систем у царинах, де вони знаходяться під контролем. Один із способів отримати залежну змінну під контролем - зменшити реакцію цієї змінної на можливий діапазон (керованої) зміни незалежної змінної на статистичний шум. Наприклад, ми знаємо, що тиск повітря співвідноситься зі здоров’ям (просто спробуйте дихати вакуумом), але якщо ми контролюємо тиск повітря до 1 +/- 0,001 атм, наскільки ймовірне, будь-яка зміна тиску повітря вплине на здоров'я?


Відмінність, яку ви шукаєте, "спостерігається у вибірці" (кореляція) та залежність, яка існує, спостерігається вона у вибірці (фізика) чи ні. У цьому поясненні немає ніякої ролі для метафізики (хоча деякі для фізичного припущення). Пружини мають еластичні межі, незалежно від того, чи досягають вони ніколи. Або на більш домашньому прикладі: кубик цукру є розчинним - чітко причинно-наслідкова концепція, що приблизно означає, що якщо його впустити в чай, він розчиниться. Але ця причинно-наслідкова властивість обумовлена ​​виключно її фізичною будовою. Кубики цукру були б розчинними, навіть якби ми ніколи не думали розчинити жодну з них.
кон'югатприор

1
Ви, звичайно, правильні, що без причинних припущень в аргументі ви не отримуєте з нього причинних висновків. Але в цьому насправді немає нічого дуже метафізичного!
кон'югатприор

fwiw контрфактична теорія причинності (наприклад, Перл або Вудвард) розроблена саме так, щоб мати сенс "Якщо A платить B робити C, що призводить до D, що є причиною D? Просто немає раціональної причини вибирати C або B або A" . Єдине старомодне уявлення і непридатне уявлення, яке ці теорії покладають на спокій, - це те, що ми завжди можемо зробити ідею про те, що в чомусь є причина. Звичайно, немає.
кон'югатприор

5

Так , всупереч попереднім відповідям. Я буду сприймати це питання як нетехнічне, зокрема визначення поняття "кореляція". Можливо, я використовую це занадто широко, але дивіться свою другу кулю. Я сподіваюся, що буде вважатися доцільним обговорити тут інші відповіді, оскільки вони висвітлюють різні частини питання. Я опираюся на підході Перла до причинно-наслідкових зв’язків, і, зокрема, я беруся до нього в деяких роботах з Кевіном Корбом. У Вудварда, мабуть, найясніший нетехнічний облік.

  • @conjugateprior говорить, що "будь-яка керована система є контрприкладом". Так, на більш сильне твердження, що некорреляція, що спостерігається у вашому експерименті, не означає причинності. Я припускаю, що питання більш загальне. Безумовно, один експеримент, можливо, не зміг контролювати причини маскування або неналежним чином контролював загальні ефекти, і приховав кореляцію. Але якщо викликає , буде контрольований експеримент, де виявиться цей взаємозв'язок. Майже всі визначення чи пояснення причинного зв'язку сприймають це як різницю, яка має значення. Тому без причинно-наслідкових зв’язків (якесь) співвідношення. Якщо в причинній байєсівській мережі є прямий зв'язок , це не означає, щоxyxyx завжди має значення для , лише те, що існує якийсь експеримент, який виправляє всі інші причини де хитає хитає .yyxy

  • @aksakal має чудовий приклад того, чому лінійна причинно-наслідкова ситуація недостатня. Домовились, але я хочу бути широким і нетехнічним. Якщо , клієнту сказати, що некорельовано з не повно . Так що я буду використовувати кореляцію дуже широко , щоб означати різницю в , надійно пов'язаний з різницею в . Він може бути нелінійним або непараметричним, як вам подобається. Порогові ефекти - це добре ( змінює , але лише в обмеженому діапазоні, або лише збільшуючи або зменшуючи певне значення, як напруга в цифрових схемах).y=x2yxxyxy

  • @Kodiologist створює приклад, коли , такале немає лінійної кореляції. Але однозначно є взаємозв'язок, який можна знайти, так співвіднесений у широкому розумінні.| у | = | х |y=Unif(x,x)|y|=|x|

  • @Szabolcs використовує генератори випадкових чисел, щоб показати вихідний потік, побудований так, щоб виглядати некорельованим. Як і цифри , потік видається випадковим, але є детермінованим. Я згоден, ви навряд чи знайдете стосунки, якщо буде вказано лише дані, але вони є.π

  • @Li Zhi зазначає, що ви не можете логічно перейти від кореляції до причинного зв'язку. Так, ніяких причин, жодних причин немає. Але питання починається з причинного зв'язку: чи передбачає це кореляція? У прикладі тиску повітря ми маємо пороговий ефект. Існує діапазон, коли тиск повітря не співвідноситься зі здоров’ям. Дійсно правдоподібно там, де це не має причинного впливу на здоров'я. Але є діапазон, де це робиться. Цього достатньо. Але, напевно, краще відзначити діапазони, де є і не є ефектом. Якщо , то існує кореляція по всьому ланцюгу, оскільки є причинно-наслідкова ситуація. Повторне спостереження (або експеримент) може показати, що не викликає безпосередньоA DABCDAD але кореляція існує тому, що є причинно-наслідкова історія.

Я не знаю, що мав на увазі @ user2088176, але я думаю, якщо ми поставимося до питання дуже загалом, то відповідь - так. Принаймні, я думаю, що це відповідь, необхідна для літератури про причинно-наслідкові розслідування та інтервенціоністського опису причинного зв'язку. Причини - це відмінності, які мають значення. І ця різниця виявиться в деякому експерименті як наполеглива асоціація.


1
Я сподівався підійти до цього з більш простої та нетехнічної точки зору, як у вас. Що означає "причина"? Імовірно, це передбачає зміну чогось, що веде до зміни чогось іншого. Я не можу зрозуміти причинність без якогось співвідношення.
Behacad

1
@Behacad Я думаю, що контраст є між якоюсь кореляцією (якоюсь річчю, яку ви можете спостерігати) і якоюсь залежністю (яка ніколи не може бути викликана). Існують незапущені залежності, але відсутні спостережувані кореляції. Ось чому причинно-наслідковий зв’язок є контрфактичним елементом його визначення, тоді як кореляція - ні.
кон'югатприор
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.