Я знаю, що кореляція не означає причинності, але чи означає відсутність кореляції відсутність причинності?
Я знаю, що кореляція не означає причинності, але чи означає відсутність кореляції відсутність причинності?
Відповіді:
чи означає відсутність кореляції відсутність причинності?
Ні. Будь-яка керована система є контрприкладом.
Без причинно-наслідкових зв’язків контроль явно неможливий, але успішний контроль означає - грубо кажучи - те, що якась кількість підтримується постійною, що означає, що вона не буде пов'язана ні з чим, включаючи те, що спричиняє постійність.
Тож у цій ситуації висновок про відсутність причинно-наслідкового зв’язку через відсутність кореляції було б помилкою.
Ось дещо актуальний приклад .
Ні. Головним чином, оскільки під кореляцією ви, швидше за все, має на увазі лінійну кореляцію . Дві змінні можна співвіднести нелінійно і можуть не відображати лінійної кореляції . Побудувати подібний приклад легко, але я наведу приклад, який ближче до вашого (вужчого) питання.
Подивимося на випадкову змінну та не випадкову функцію , за допомогою якої ми створюємо випадкову змінну . Остання явно викликана колишньою змінною, а не просто співвіднесеною. Давайте намалюємо графік розкидання:
Приємна, чітка нелінійна кореляційна картина, але в цьому випадку це також пряма причинність. Однак коефіцієнт лінійної кореляції є незначним, тобто немає лінійної кореляції, незважаючи на очевидну нелінійну кореляцію і навіть причинність:
>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)
rho =
0.0140
pval =
0.8904
ОНОВЛЕННЯ: @Kodiologist має рацію в коментарі. Математично можна показати, що коефіцієнт лінійної кореляції для цих двох змінних дійсно дорівнює нулю. У моєму прикладі є стандартною звичайною змінною, тому у нас є таке: Отже, коваріація (а згодом кореляція) дорівнює нулю:
Ми отримали однаковий результат для будь-якого симетричного розподілу, наприклад, рівномірного .
Ні . Зокрема, випадкові величини можуть бути залежними, але некорельованими.
Ось приклад. Припустимо, у мене є машина, яка приймає один вхід і видає випадкове число , яке дорівнює або або з однаковою ймовірністю. Ясно викликає . Тепер нехай - випадкова величина, рівномірно розподілена на і виберіть з , індукуючи спільний розподіл на . і залежні, оскільки
Однак співвідношення і дорівнює 0, оскільки
Краща відповідь на питання полягає в тому, що кореляція - це статистична, математична та / або фізична залежність, а причинно-наслідкова зв’язок - метафізична залежність. Ви не можете ЛОГІЧНО пройти шлях від кореляції (або некореляції) до причинного зв'язку, без (великого) набору припущень, що зв'язують метафізику з фізикою. (Один із прикладів - те, що двоє людей можуть погодитися бути "раціональним спостерігачем", є значною мірою довільним і, ймовірно, неоднозначним). Якщо A платить B, щоб робити C, що призводить до D, то в чому причина D? Просто немає раціональної причини вибирати C, B або A (або будь-яку з попередників подій A). Теорія управління стосується систем у царинах, де вони знаходяться під контролем. Один із способів отримати залежну змінну під контролем - зменшити реакцію цієї змінної на можливий діапазон (керованої) зміни незалежної змінної на статистичний шум. Наприклад, ми знаємо, що тиск повітря співвідноситься зі здоров’ям (просто спробуйте дихати вакуумом), але якщо ми контролюємо тиск повітря до 1 +/- 0,001 атм, наскільки ймовірне, будь-яка зміна тиску повітря вплине на здоров'я?
Так , всупереч попереднім відповідям. Я буду сприймати це питання як нетехнічне, зокрема визначення поняття "кореляція". Можливо, я використовую це занадто широко, але дивіться свою другу кулю. Я сподіваюся, що буде вважатися доцільним обговорити тут інші відповіді, оскільки вони висвітлюють різні частини питання. Я опираюся на підході Перла до причинно-наслідкових зв’язків, і, зокрема, я беруся до нього в деяких роботах з Кевіном Корбом. У Вудварда, мабуть, найясніший нетехнічний облік.
@conjugateprior говорить, що "будь-яка керована система є контрприкладом". Так, на більш сильне твердження, що некорреляція, що спостерігається у вашому експерименті, не означає причинності. Я припускаю, що питання більш загальне. Безумовно, один експеримент, можливо, не зміг контролювати причини маскування або неналежним чином контролював загальні ефекти, і приховав кореляцію. Але якщо викликає , буде контрольований експеримент, де виявиться цей взаємозв'язок. Майже всі визначення чи пояснення причинного зв'язку сприймають це як різницю, яка має значення. Тому без причинно-наслідкових зв’язків (якесь) співвідношення. Якщо в причинній байєсівській мережі є прямий зв'язок , це не означає, що завжди має значення для , лише те, що існує якийсь експеримент, який виправляє всі інші причини де хитає хитає .
@aksakal має чудовий приклад того, чому лінійна причинно-наслідкова ситуація недостатня. Домовились, але я хочу бути широким і нетехнічним. Якщо , клієнту сказати, що некорельовано з не повно . Так що я буду використовувати кореляцію дуже широко , щоб означати різницю в , надійно пов'язаний з різницею в . Він може бути нелінійним або непараметричним, як вам подобається. Порогові ефекти - це добре ( змінює , але лише в обмеженому діапазоні, або лише збільшуючи або зменшуючи певне значення, як напруга в цифрових схемах).
@Kodiologist створює приклад, коли , такале немає лінійної кореляції. Але однозначно є взаємозв'язок, який можна знайти, так співвіднесений у широкому розумінні.| у | = | х |
@Szabolcs використовує генератори випадкових чисел, щоб показати вихідний потік, побудований так, щоб виглядати некорельованим. Як і цифри , потік видається випадковим, але є детермінованим. Я згоден, ви навряд чи знайдете стосунки, якщо буде вказано лише дані, але вони є.
@Li Zhi зазначає, що ви не можете логічно перейти від кореляції до причинного зв'язку. Так, ніяких причин, жодних причин немає. Але питання починається з причинного зв'язку: чи передбачає це кореляція? У прикладі тиску повітря ми маємо пороговий ефект. Існує діапазон, коли тиск повітря не співвідноситься зі здоров’ям. Дійсно правдоподібно там, де це не має причинного впливу на здоров'я. Але є діапазон, де це робиться. Цього достатньо. Але, напевно, краще відзначити діапазони, де є і не є ефектом. Якщо , то існує кореляція по всьому ланцюгу, оскільки є причинно-наслідкова ситуація. Повторне спостереження (або експеримент) може показати, що не викликає безпосередньоA D але кореляція існує тому, що є причинно-наслідкова історія.
Я не знаю, що мав на увазі @ user2088176, але я думаю, якщо ми поставимося до питання дуже загалом, то відповідь - так. Принаймні, я думаю, що це відповідь, необхідна для літератури про причинно-наслідкові розслідування та інтервенціоністського опису причинного зв'язку. Причини - це відмінності, які мають значення. І ця різниця виявиться в деякому експерименті як наполеглива асоціація.