Як математично визначається причинно-наслідковий зв’язок?


16

Яке математичне визначення причинно-наслідкового зв’язку між двома випадковими змінними?

З огляду на вибірку із спільного розподілу двох випадкових величин і , коли ми говоримо, що викликає Y ?XYXY

З контексту я читаю цей документ про причинно-наслідкове виявлення .


2
Наскільки я можу побачити причинність - це наукове не математичне поняття. Чи можете ви редагувати, щоб уточнити?
mdewey

2
@mdewey Я не згоден. Причинність може бути знята з цілком формальних термінів. Дивіться, наприклад, мою відповідь.
Кодіолог

Відповіді:


9

Яке математичне визначення причинно-наслідкового зв’язку між двома випадковими змінними?

Математично причинно-наслідкова модель складається з функціональних зв'язків між змінними. Наприклад, розглянемо систему структурних рівнянь нижче:

x=fx(ϵx)y=fy(x,ϵy)

Це означає, що функціонально визначає значення (якщо ви втручаєтесь у це змінює значення ), але не навпаки. Графічно це зазвичай представлено , що означає, що входить в структурне рівняння y. Як додаток, ви також можете висловити причинно-наслідкову модель з точки зору спільного розподілу контрфактичних змінних, що математично еквівалентно функціональним моделям .xyxyxyx

З огляду на вибірку із спільного розподілу двох випадкових величин X і Y, коли ми говоримо, що X викликає Y?

Іноді (або в більшості випадків) у вас немає знань про форму структурних рівнянь ,fxfy xyyxp(y,x) , навіть навіть про те, чи чи . Єдина інформація, яку ви маєте, - це спільний розподіл ймовірностей (або вибірки з цього розподілу).xyyxp(y,x)

Це призводить до вашого запитання: коли я можу відновити напрямок причинності лише з даних? Або, точніше, коли я можу відновити, чи входить у структурне рівняння або навпаки, лише з даних?xy

Звичайно, без принципово непереборних припущень щодо причинно-наслідкової моделі це неможливо . Проблема полягає в тому, що кілька різних причинно-наслідкових моделей можуть спричинити за собою однаковий спільний розподіл ймовірностей спостережуваних змінних. Найпоширеніший приклад - причинно-наслідкова лінійна система з гаусовим шумом.

Але за деякими причинно-наслідковими припущеннями, це може бути можливим --- і саме на це працює література з причинного виявлення. Якщо у вас немає попереднього викриття цієї теми, ви можете почати з « Елементів причинного висновку » Петерса, Джанзінга та Шолкопфа, а також з глави 2 «Причинності » Юдеї Перл. У нас на темі CV є посилання на причинно-наслідкове виявлення , але у нас ще не так багато посилань.

Отже, на ваше запитання не існує лише однієї відповіді, оскільки це залежить від припущень, які ви робите. У роботі, яку ви згадуєте, наводяться деякі приклади, такі як припущення лінійної моделі з неаусовим шумом. Цей випадок відомий як ЛІНГАН (скорочення для лінійної не-гауссової ациклічної моделі), ось приклад у R:

library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1

# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat") 

# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
#     [,1]  [,2]
# [1,] .     .   
# [2,]  TRUE .     

Зверніть увагу, у нас є лінійна причинно-наслідкова модель з неаууссовим шумом, де викликає а lingam правильно відновлює причинний напрямок. Однак зауважте, що це критично залежить від припущень LINGAM.x2x1

Що стосується цитованої вами статті, вони роблять це конкретне припущення (див. Їх "постулат"):

Якщо , то мінімальна довжина опису механізму, що відображає X на Y, не залежить від значення X, тоді як мінімальна довжина опису механізму, що відображає Y на X, залежить від значення Y.xy

Зауважте, це припущення. Це ми називали б їх "умовою ідентифікації". По суті, постулат встановлює обмеження на спільний розподіл . Тобто, в постулаті сказано, що якщо у даних є певні обмеження, а якщо інші обмеження, дотримуються. Ці типи обмежень, які мають тестові наслідки (накладають обмеження на ), - це те, що дозволяє напряму відновити дані спостережень.p(x,y)xyyxp(y,x)

На завершення, результати причинного виявлення все ще дуже обмежені і залежать від вагомих припущень. Будьте уважні, застосовуючи їх у реальному контексті.


1
Чи є шанс ви доповнити свою відповідь, щоб якось включити кілька простих прикладів із підробленими даними, будь ласка? Наприклад, прочитавши трохи Елементів причинного висновку та переглянувши деякі лекції Пітерса, і зазвичай використовується система регресії для мотивації необхідності детального розуміння проблеми (я навіть не торкаюся їх роботи в ICP). У мене таке враження (можливо, помилкове), що у ваших спробах відійти від RCM ваші відповіді виключають усі фактичні механізми моделювання.
usεr11852 повідомляє Відновити Моніку

1
@ usεr11852 Я не впевнений, що я розумію контекст ваших питань, чи хочете ви прикладів причинного виявлення? У самій роботі, яку Джейн подала, є кілька прикладів. Крім того, я не впевнений, що я розумію, що ви маєте на увазі під "уникненням RCM та відмови від реальних матеріальних моделюючих машин", які матеріальні машини ми не вистачаємо тут у контексті причинного виявлення?
Карлос Сінеллі

1
Вибачте за плутанину, мене не цікавлять приклади з паперів. Я можу сам цитувати інші документи. (Наприклад, Lopez-Paz et al. CVPR 2017 про їх коефіцієнт нейронної причинної зв'язку) Мене цікавить простий числовий приклад з фальшивими даними про те, що хтось працює в R (або улюбленій мові), і подивіться, що ви маєте на увазі. Якщо ви цитуєте, наприклад, Peters 'et al. книги, і вони мають невеликі фрагменти коду, які дуже корисні (а іноді і просто використовуються lm). Ми не можемо всі працювати навколо спостережних зразків наборів даних Тюбінген, щоб отримати уявлення про причинно-наслідкове виявлення! :)
usεr11852 повідомляє Відновити Моніку

1
@ usεr11852 Впевнений, що фальшивий приклад є тривіальним, я можу включити той, який використовує lingam в Р. Але чи хотіли б ви пояснити, що ви мали на увазі під "уникненням RCM та залишенням реальних відчутних механізмів моделювання"?
Карлос Сінеллі

2
@ usεr11852 добре дякую за відгук, я спробую включити більше коду, коли це доречно. На завершення, результати причинного виявлення все ще дуже обмежені, тому людям потрібно бути дуже обережними, застосовуючи їх залежно від контексту.
Карлос Сінеллі

4

Існує різноманітний підхід до формалізації причинності (що відповідає суттєвій філософській розбіжності щодо причинності, яка існувала століттями). Популярний - з точки зору потенційних результатів. Підхід потенційних результатів, який називається Рубіновою причинною моделлю , передбачає, що для кожного причинного стану речей існує різна випадкова величина. Отже, може бути випадковою змінною можливих результатів клінічного випробування, якщо суб'єкт приймає досліджуваний препарат, а може бути випадковою змінною, якщо він приймає плацебо. Причинний ефект - різниця між та . Якщо насправдіY1Y2Y1Y2Y1=Y2, можна сказати, що лікування не має ефекту. В іншому випадку можна сказати, що стан лікування викликає результат.

Причинно-наслідкові зв’язки між змінними можуть бути також представлені спрямованими ацилічними графіками , які мають дуже різний аромат, але виявляються математично еквівалентними моделі Рубіна (Wasserman, 2004, розділ 17.8).

Васерман, Л. (2004). Вся статистика: стислий курс статистичного висновку . Нью-Йорк, Нью-Йорк: Спрінгер. ISBN 978-0-387-40272-7.


Дякую. що було б випробуванням для цього, отримавши набір зразків із спільного розподілу?
Джейн

3
Я читаю arxiv.org/abs/1804.04622 . Я не читав його посилань. Я намагаюся зрозуміти, що означає причинність на основі даних спостережень.
Джейн

1
Я перепрошую (-1), це не те , питається, ви не дотримуєтеся , ні Y 2 , ви помічаєте зразок фактичних змінних X , Y . Дивіться папір, яку пов’язала Джейн. Y1Y2XY
Карлос Сінеллі

2
@Vimal: Я розумію випадок, коли ми маємо "інтервенційні розподіли". У нас немає "інтервенційних розподілів" у цій обстановці, і саме це ускладнює розуміння. У мотиваційному прикладі в роботі вони наводять щось на зразок . Умовний розподіл y, заданий x, по суті, є розподілом шуму ϵ плюс деякий переклад, в той час як це не справедливо для умовного розподілу x, заданого y. Я ініціативно розумію приклад. Я намагаюся зрозуміти, що таке загальне визначення для спостережливого виявлення причинності. (x,y=x3+ϵ)ϵ
Джейн

2
@Jane для спостережного випадку (для вашого запитання), загалом ви не можете зробити висновок про причинність чисто математично, принаймні для двох змінних випадків. Щодо більшої кількості змінних, за додаткових (незаперечних) припущень ви можете подати претензію, але висновок все ще може бути сумнівом. Ця дискусія дуже тривала в коментарях. :)
Vimal

0

ХY

  1. XY

Втручання - це хірургічна зміна змінної, яка не впливає на змінні, від яких залежить. Втручання були чітко формалізовані в структурних рівняннях та причинно-наслідкових графічних моделях, але, наскільки я знаю, немає визначення, яке не залежало б від конкретного модельного класу.

  1. YX

XY

У сучасних підходах до причинного зв'язку втручання розглядається як примітивний об'єкт, який визначає причинно-наслідкові зв’язки (визначення 1). На мою думку, однак, втручання є відображенням і обов'язково узгоджується з динамікою моделювання.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.