За яких умов кореляція передбачає причину?


85

Всі ми знаємо, що мантра "співвідношення не означає причинно-наслідкового зв'язку", яка міститься у всіх студентів першого курсу статистики. Є деякі хороші приклади тут , щоб проілюструвати цю ідею.

Але іноді кореляція робить на увазі причинно - наслідковий зв'язок. Наступний приклад - із цієї сторінки Вікіпедії

Наприклад, можна провести експеримент на однакових близнюках, які, як відомо, постійно отримували однакові оцінки на своїх тестах. Одного близнюка відправляють на навчання на шість годин, а другого відправляють до парку розваг. Якщо їхні тестові бали раптово розійшлися в значній мірі, це може бути вагомим доказом того, що навчання (або відвідування парку розваг) спричиняло причинний вплив на тестові бали. У цьому випадку співвідношення балів за вивчення та тестування майже напевно означатиме причину.

Чи існують інші ситуації, коли кореляція передбачає причину?


16
Кореляція та вагома причина, що лежить в основі, посилаються на причинну причину, доки не доведеться інше, мабуть, найкраще, що можна отримати.
Джеймс

8
Хіба не Карл Поппер сказав, що людина не може встановити причинності: наукові теорії мають абстрактний характер. Вони можуть бути фальсифікованими, і той факт, що ми створюємо труднощі з фальсифікацією чогось, змушує задуматися про причинність ...
Робін Жирард

3
Цікавий зустрічний приклад від Джейнеса: у нас дедуктивне відношення "без хмар" означає "немає дощу"; все ж хто б повірив, що "без хмар" є фізичною причиною "немає дощу"?
ймовірністьлогічний

4
Давайте вживаємо інший термін, ніж «натякнути», оскільки в словнику його значення включають як 1. Запропонувати, так і 2.
Неосвітлити

Чи має цей близнюк приклад навіть сенс? Я маю на увазі причинну причину, що має на увазі те, що відмінності між методами / режимами вивчення викликають відмінності в тестових показниках для близнюків. Але це зразок одного, і навіть з великим зразком, все, що потрібно, це один набір близнюків, щоб мати протилежну реакцію на порушення гіпотези, стиль чорного лебедя ... @probabilityislogic: чи поняття "немає хмар" має фізичну значення? Якщо так, то я не розумію, чому друга частина не вірна.
naught101

Відповіді:


33

Кореляція недостатня для причинного зв'язку. Можна обійти приклад Вікіпедії, уявивши, що ці близнюки завжди обманювали тести, маючи пристрій, який дає їм відповіді. Близнюк, який йде до парку розваг, втрачає пристрій, отже, низький рівень.

Хороший спосіб зрозуміти цей матеріал - це думати про структуру байєсівської мережі, яка, можливо, генерує виміряні величини, як це зробив Перл у своїй книзі « Причинність» . Його основний пункт - пошук прихованих змінних. Якщо є прихована змінна, яка не змінюється в вимірюваній вибірці, то кореляція не передбачає причинного зв'язку. Викрийте всі приховані змінні, і у вас виникнення причин.


У мене є проблеми з розумінням того, чому напрямки стрілок у відповідній байєсівській мережі мають якесь відношення до причинного зв'язку. Наприклад, A-> B і B-> A представляють різні напрямки причинності, але байєсівські мережі для цих двох структур рівнозначні
Ярослав Булатов

6
Вони не є рівнозначними за умови втручань.
Ніл Г

Ці байєсівські мережі є рівнозначними в тому сенсі, що за даними, вибіреними з однієї з них, ви не можете сказати, що це було
Ярослав Булатов

4
Е ... я не знайомий з реальними статистичними даними з дальнього вистрілу ... але хіба "оголення всіх прихованих змінних" за визначенням неможливо? Звідки ви знаєте, коли більше немає «прихованих» змінних?
Крейг Уокер

4
@Craig У цьому справа; це неможливо.
Джастін Л.

35

Я просто додам кілька додаткових коментарів щодо причинності, якщо розглядатись з епідеміологічної точки зору . Більшість цих аргументів взяті з Практичної психіатричної епідеміології , Prince та ін. (2003).

Причинно-наслідкові зв’язки або інтерпретація причинності є, безумовно, найскладнішими аспектами епідеміологічних досліджень. Дослідження когорти та поперечного перерізу можуть призвести, наприклад, до ефекту конфунгі. Цитуючи С. Менарда ( Longitudinal Research , Paper University 76, 1991), Б. Б. Ашер у причинному моделюванні (Sage, 1976) спочатку запропоновано виконати наступний набір критеріїв:

  • Розглянуті явища або змінні повинні бути коваріаційними, як це вказується, наприклад, різницею між експериментальною та контрольною групами або ненульовою кореляцією між двома змінними.
  • Зв'язок не повинен бути віднесений до будь-якої іншої змінної або набору змінних, тобто він не повинен бути помилковим, але повинен зберігатися навіть тоді, коли керуються іншими змінними, як це вказується, наприклад, вдалою рандомізацією експериментальної конструкції (різниці між експериментальною та контрольні групи до лікування) або ненульовою частковою кореляцією двох змінних з іншою змінною, утримуваною постійною.
  • Передбачувана причина повинна передувати або бути одночасно з передбачуваним ефектом у часі, на що вказує зміна причини, що виникає не пізніше супутньої зміни ефекту.

Хоча перші два критерії можна легко перевірити за допомогою поперечного перерізу або впорядкованого за часом дослідження поперечного перерізу, останній може бути оцінений лише за допомогою поздовжніх даних, за винятком біологічних чи генетичних характеристик, для яких тимчасовий порядок можна припустити без поздовжніх даних. Звичайно, ситуація стає більш складною у випадку нерекурсивного причинного зв'язку.

Мені також подобається наступна ілюстрація (глава 13, у вищезгаданій довідці), яка узагальнює підхід, оприлюднений Хіллом (1965), який включає 9 різних критеріїв, пов'язаних з ефектом причинного зв’язку, як це також цитував @James. Оригінальна стаття справді мала назву "Навколишнє середовище та хвороби: асоціація чи причинний зв’язок?" ( Версія PDF ).

Пагорб1965

Нарешті, Глава 2 найвідомішої книги Ротмана « Сучасна епідеміологія» (1998, Lippincott Williams & Wilkins, 2-е видання) пропонує дуже повну дискусію щодо причинно-наслідкових та причинно-наслідкових висновків, як із статистичної, так і з філософської точки зору.

Я хотів би додати наступні посилання (грубо взяті з онлайн-курсу з епідеміології) також дуже цікаві:

Нарешті, цей огляд пропонує ширший погляд на причинно-наслідкове моделювання, причинно-наслідкове висновок у статистиці: огляд (J Pearl, SS 2009 (3)).


18

В основі вашого питання лежить питання "коли стосунки є причиною?" Це не просто має бути кореляцією, що передбачає (чи ні) причину.

Хороша книга на цю тему називається переважно нешкідливою економетрикою Джоуа Ангріст та Джорн-Стеффен Пішке. Вони починаються з експериментального ідеалу, де ми можемо певним чином рандомізувати досліджуване "лікування", а потім переходимо до альтернативних методів генерування цієї рандомізації з метою залучення причинних впливів. Це починається з вивчення так званих природних експериментів.

Одним з перших прикладів природного експерименту, який використовується для виявлення причинно-наслідкових зв’язків, є праця Ангріста 1989 р. "Доходи за все життя та розіграш лотереї В'єтнамської ери". У цьому документі спробується оцінити вплив військової служби на довічні заробітки. Ключова проблема в оцінці будь-якого причинного ефекту полягає в тому, що певні типи людей можуть бути більш схильні до зарахування, що може упереджувати будь-яке вимірювання відносин. Ангріст використовує природний експеримент, створений в'єтнамською лотерейною лотереєю, щоб ефективно "випадково призначити" лікування "військовою службою" групі чоловіків.

Так коли ж у нас виникнення причинності? В експериментальних умовах. Коли ми наближаємось? Під природними експериментами. Існують також інші методи, які наближають нас до «причинності», тобто вони набагато краще, ніж просто використовувати статистичний контроль. Вони включають розрив регресії, різницю у різниці тощо.


15

Існує також проблема з протилежним випадком, коли відсутність кореляції використовується як доказ відсутності причинного зв'язку. Ця проблема - нелінійність; при перегляді кореляції люди зазвичай перевіряють Пірсона, який є лише вершиною айсберга.


14

Ваш приклад - приклад контрольованого експерименту . Єдиний інший контекст, з якого я знаю, де кореляція може означати причину, - це природний експеримент .

В основному, природний експеримент користується перевагою дозволу деяких респондентів на лікування, яке відбувається природним чином у реальному світі. Оскільки залучення респондентів до лікувальних та контрольних груп не контролюється експериментатором, те, наскільки кореляція передбачає причинну причину, може бути дещо слабшою.

Перегляньте посилання на wiki для отримання додаткової інформації з контрольованими / природними експериментами.


12

На мою думку, Статистична група APA узагальнила це досить добре

'' Визначення причинності від нераціоналізованих конструкцій є ризикованим підприємством. Дослідники, які використовують нераціоналізовані конструкції, мають додатковий обов’язок пояснити логіку, що стоїть за коваріатами, що входять до їхніх проектів, та попередити читача про правдоподібні гіпотези конкурентів, які можуть пояснити їх результати. Навіть у рандомізованих експериментах присвоєння причинних наслідків будь-якому з аспектів стану лікування вимагає підтримки додаткових експериментів. '' - APA Task Force


11

Звернення президента сера Остіна Бредфорд Хіла до Королівського медичного товариства ( довкілля та хвороба: асоціація чи причинність? ) Пояснює дев'ять критеріїв, які допомагають визначити, чи існує причинно-наслідковий зв’язок між двома корельованими чи пов'язаними змінними.

Вони є:

  1. Сила асоціації
  2. Послідовність: "це неодноразово спостерігалося різними особами, в різних місцях, обставинах та часі?"
  3. Специфіка
  4. Тимчасовість: "який візок, а який - кінь?" - причина повинна передувати наслідку
  5. Біологічний градієнт (крива доза-відповідь) - яким чином залежать величина ефекту від величини (підозрюваної) причинної змінної?
  6. Правдоподібність - чи є ймовірне пояснення причинного зв'язку?
  7. Злагодженість - чи буде причинність суперечити іншим встановленим фактам?
  8. Експеримент - чи впливає експериментальне маніпулювання причинною змінною (підозрюваної) на змінну (підозрювану)
  9. Аналогія - чи раніше у нас виникали подібні причинно-наслідкові зв’язки?

9

У прикладі близнюків це не лише кореляція, що говорить про причинність, але й пов'язану з цим інформацію чи попередні знання.

Припустимо, я додаю ще одну інформацію. Припустимо, що старанний близнюк витратив 6 годин на вивчення іспиту статистики, але через невдалу помилку іспит був в історії. Чи все-таки ми зробимо висновок, що дослідження стало причиною вищої ефективності?

Визначення причинності є настільки ж філософським питанням, як і наукове, отже, тенденція викликати таких філософів, як Девід Юм та Карл Поппер, коли йдеться про причинність.

Не дивно, що медицина зробила вагомий внесок у встановлення причинності через евристику, як-от постулати Коха для встановлення причинно-наслідкового зв’язку між мікробами та хворобою. Вони поширюються на "молекулярні постулати Коха", необхідні для того, щоб показати, що ген збудника кодує продукт, який сприяє захворюванню, спричиненому збудником.

На жаль, я не можу розміщувати гіперпосилання, нібито, ЗАПЕРЕДЖЕННЯ Я новий користувач (неправда) і не маю достатньо "балів репутації". Справжня причина - чиїсь здогадки.


9

Кореляція сама по собі ніколи не передбачає причинного зв'язку. Це так просто.

Але дуже рідко є лише кореляція між двома змінними. Часто ви також знаєте щось про те, які ці змінні є, і теорія, або теорії, підказуючи, чому між змінними може бути причинно-наслідковий зв’язок. Якщо ні, то ми турбуємось про перевірку кореляції? (Однак люди, які видобувають масивні кореляційні матриці для значних результатів, часто не мають випадкової теорії - інакше, навіщо турбувати видобуток. Протилежним аргументом є те, що часто потрібні розвідки, щоб отримати ідеї для випадкових теорій. І так далі, і так далі ...)

Відповідь на поширену критику "Так, але це лише співвідношення: це не означає причинності":

  1. Для випадкових відносин кореляція необхідна. Повторне неспроможність знайти кореляцію справді буде поганою новиною.
  2. Я не дав тобі співвіднесення.
  3. Потім продовжуйте пояснювати можливі причинно-наслідкові механізми, що пояснюють кореляцію ...

2
Контрприклад вашої точки №1: у хаотичній системі ви можете мати причинно-наслідкові зв’язки без очевидних кореляцій.
mkt

8

Одна корисна достатня умова для деяких визначень причинного зв'язку:

Причинну причину можна стверджувати, коли одну з корельованих змінних можна керувати (ми можемо безпосередньо встановити її значення) і кореляція все ще присутня.


2
Можна також використовувати слово Перла для "безпосередньо встановлення [значення змінної]": втручання.
Ніл G

8
  1. Майже завжди в рандомізованих випробуваннях
  2. Майже завжди в спостережному дослідженні, коли хтось вимірює всіх прихильників (майже ніколи)
  3. Іноді, коли хтось вимірює противників (IC * алгоритм виявлення DAG в книзі Причинності Перла)
  4. У не-гауссових лінійних моделях з двома або більше змінними, але не використовують кореляцію як міру взаємозв'язку ( LiNGAM )

Більшість алгоритмів відкриття реалізовані в Tetrad IV


6

Можливо, пов'язане питання - за яких умов можна надійно дістати причинно-наслідкові зв’язки з даних?

На семінарі NIPS 2008 року спробуйте вирішити це питання емпірично. Одним із завдань було визначити напрямок причинності із спостережень пар змінних, коли одна змінна, як відомо, викликала іншу, а найкращий метод зміг правильно вивести причинний напрямок у 80% часу.


3

Майже напевно у добре розробленому експерименті. (Створена, звичайно, для отримання такої зв'язку .)


3

Припустимо, ми думаємо, що фактор A є причиною явища B. Тоді ми намагаємось його змінити, щоб побачити, чи змінюється B. Якщо B не змінюється, і якщо ми можемо вважати, що все інше незмінним, вагомі докази того, що A не є причиною B. Якщо B все-таки зміниться, ми не можемо зробити висновок, що A є причиною, оскільки зміна A могло спричинити зміна фактичної причинно-наслідкової зв'язку C, яка призвела до зміни B.


Чи можете ви зробити варіювати A?
RockScience

2

Я помітив, що тут було використано "доказ", коли обговорювали емпіричну парадигму. Немає такого. Спочатку приходить гіпотеза, де ідея висувається; потім відбувається тестування в "контрольованих умовах" [примітка a], і якщо виникла "достатня" відсутність спростування , вона переходить до стадії гіпотези... період. Немає жодних доказів, якщо тільки не вдасться 1) зуміти бути при кожному виникненні зазначеної події [примітка b] і, звичайно, 2) встановити причину. 1) є малоймовірним у нескінченному Всесвіті [відзначте нескінченність природою неможливо довести]. Примітка А; жоден експеримент не проводиться в цілком контрольованих умовах, і чим більш контрольовані умови, тим менше схожість із зовнішнім Всесвітом з явно нескінченними лініями причинності. Примітка б; Пам’ятайте, ви повинні чудово описати сказану «подію», що, імовірно, означає ідеально правильну мову = імовірно, не людську мову. Для остаточної ноти, всі причинно-наслідкові стосунки, ймовірно, відносяться до Першої події. Тепер поговоримо з усіма з теорією. Так, я вчився офіційно та неофіційно. В кінці; ні, близькість не означає причинно-наслідкового зв’язку і навіть нічого іншого, крім тимчасової кореляції.


1

XY

Y=bX+u

bXYE(b)=BXuE(u|X)=0u YXY

Незаангажованість є бажаною властивістю оцінювача, але ви також хочете, щоб ваш оцінювач був ефективним (низька дисперсія) та послідовним (має тенденцію до істинного значення). Див. Припущення Гаусса-Маркова.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.