Які теорії причинності я повинен знати?


16

Які теоретичні підходи до причинності я повинен знати як прикладний статистик / економетрик?

Я знаю (дуже небагато)

Які поняття я пропускаю або мені слід знати?

Пов'язане: Які теорії є основою причинності в машинному навчанні?

Я прочитав ці цікаві запитання та відповіді ( 1 , 2 , 3 ), але думаю, це питання інше. І я був дуже здивований, побачивши, що "причинність", наприклад, не згадується в " Елементах статистичного навчання" .


2
Ознайомтеся з оглядом Ендрю Гелмана на декілька праць про причинність у AJS: Gelman, A. (2011). Причинність та статистичне навчання. Американський журнал соціології, 117 (3), 955-966. doi: 10.1086 / 662659 . Це короткий огляд причинності в суспільній науці з конкретними посиланнями на праці Рубіна та Перла, а також деякі інші. Гарне місце для перегляду посилань.
paqmo

1
Для початку (Джон Стюарт) методи Мілла. en.wikipedia.org/wiki/Mill's_Methods
noumenal

Дивіться мій коментар під прийнятою відповіддю щодо можливого неправильного тлумачення причинності Грейнджера там.
Річард Харді

Відповіді:


17

Власне кажучи, «причинність Грейнджера» - це зовсім не про причинність. Йдеться про здатність прогнозування / часовий пріоритет, ви хочете перевірити, чи корисний один часовий ряд для передбачення іншого часового ряду --- він підходить для тверджень на кшталт "зазвичай A трапляється до того, як відбувається B" або "знаючи, A допомагає мені передбачити, що B відбудеться", але не навпаки "(навіть після розгляду всієї минулої інформації про ). Вибір цього імені був дуже невдалим, і це було причиною кількох помилок.Б

Хоча майже не суперечить, що причина повинна передувати її наслідку в часі, щоб зробити причинно-наслідкові висновки з часовим пріоритетом, серед інших джерел помилкових асоціацій все-таки потрібно стверджувати відсутність плутанини.

Щодо потенційних результатів (Неймана-Рубіна) проти причинних графіків / Моделювання структурних рівнянь (Перлина), я б сказав, що це помилкова дилема, і вам слід навчитися обом.

По-перше, важливо помітити, що це не протилежні погляди щодо причинності . Як вважає Перл, існує ієрархія стосовно (причинних) завдань висновку:

  1. Спостережне прогнозування
  2. Прогнозування під втручанням
  3. Контрфакти

Для першого завдання потрібно лише знати спільний розподіл спостережуваних змінних. Для другого завдання потрібно знати спільний розподіл та причинну структуру. Для останнього завдання, контрфактики, вам знадобиться додаткова інформація про функціональні форми вашої моделі структурного рівняння.

Отже, якщо говорити про контрфакти, є формальна рівновага між обома перспективами . Різниця полягає в тому, що потенційні результати сприймають контрафактичні твердження як примітиви, а в DAG-контрфактики, здається, випливають із структурних рівнянь. Однак ви можете запитати, якщо вони "еквівалентні", навіщо турбувати навчання обом? Тому що існують відмінності з точки зору «легкості» висловлювати та виводити речі.

Наприклад, спробуйте висловити концепцію M-Bias, використовуючи лише потенційні результати --- Я ніколи не бачив хорошого. Насправді мій досвід поки що полягає в тому, що дослідники, які ніколи не вивчали графіки, навіть не знають про це. Крім того, викладення змістових припущень вашої моделі графічною мовою полегшить обчислювальні результати, щоб отримати її емпіричні наслідки, які можна перевірити, та відповісти на питання ідентифікації. З іншого боку, інколи людям буде легше спочатку подумати безпосередньо про контрфакти, і поєднати це з параметричними припущеннями, щоб відповісти на дуже конкретні запити.

Можна сказати набагато більше, але справа тут в тому, що ви повинні навчитися "говорити на обох мовах". Для довідок ви можете дізнатися, як розпочати тут.


1
Чи можете ви надати приклад того, що легко виразити через PO, але не у DAG?
Гільгерме Дуарте

Величини посередництва @GuilhermeDuarte, які стосуються вкладених контрфактів, наприклад
Карлос Сінеллі

3
AGrangerBABБ

@RichardHardy Я думаю, що ти маєш рацію, можливо, ідеальний півень, який гуляє завжди за годину до сходу сонця, може мати деяку передбачувальну силу поза лінійною моделлю часового ряду сходу (оскільки схід сонця не є однаковим щодня), але з ідеальною моделлю це, мабуть, нічого не додає.
Карлос Сінеллі

Я думаю, що причинність Грейнджера не пропонує використовувати нижчі моделі прогнозування з лише історією B для обгрунтування необхідності додаткової змінної A, а отже, і причинності Грейнджера. Швидше, можна було б націлитись на якомога більшу модель, використовуючи власну історію B, а потім побачити, чи додавання A (в якійсь формі) допомагає передбачити B. І звичайно, «ідеальний півень» - це досить утопічна концепція. Враховуючи це, я думаю, що редагування відповіді, щоб відобразити це, може бути хорошою ідеєю.
Річард Харді
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.