Книга Чому Джудея Перл: Чому він обводить статистику?


79

Я читаю книгу Юдеї Перли, чому вона потрапляє мені під шкіру 1 . Зокрема, мені здається, що він беззастережно базується на "класичній" статистиці, висуваючи солом'яний аргумент що статистика ніколи, ніколи не може досліджувати причинно-наслідкові зв'язки, що її ніколи не цікавлять причинно-наслідкові відносини, і що статистика "стала моделлю - підприємство з скороченням даних ". Статистика стає некрасивим словом у його книзі.

Наприклад:

Статистики були дуже заплутані щодо того, які змінні слід і не слід контролювати, тому практика за замовчуванням полягала в тому, щоб контролювати все, що можна виміряти. [...] Це зручна, проста процедура, яку слід дотримуватися, але вона є і марною, і помиляється помилками. Ключовим досягненням Причинної революції було припинення цієї плутанини.

У той же час, статистики сильно недооцінюють контролінг у тому сенсі, що вони взагалі нелюбові говорити про причинність [...]

Однак причинно-наслідкові моделі були в статистиці, як, назавжди. Я маю на увазі, що регресійну модель можна використовувати по суті причинно-наслідкової моделі, оскільки ми по суті припускаємо що одна змінна є причиною, а інша - ефектом (отже, кореляція відрізняється підходом від регресійного моделювання) і перевіряє, чи пояснює цей причинний зв’язок спостережувані закономірності .

Ще одна цитата:

Недарма статистики, зокрема, вважали цю загадку [проблемою Монті Холла] важкою для розуміння. Вони звикли, як висловлювався Р. А. Фішер (1922), "зменшенням даних" і ігноруванням процесу генерації даних.

Це нагадує мені відповідь, яку Ендрю Гельман написав до відомого мультфільму xkcd про байесів і частотантів: "Все-таки я вважаю, що мультфільм в цілому несправедливий, оскільки він порівнює розумного байесівця з частою статистикою, яка сліпо слідує порадам дрібних підручників . "

Кількість хибного викладу s-слова, яке, як я його сприймаю, існує в книзі Judea Pearls, змусило мене замислитись, чи не є сумнівним причинний висновок (який я досі сприймав як корисний та цікавий спосіб організації та перевірки наукової гіпотези 2 ).

Запитання: чи вважаєте ви, що Юдея Перл неправильно представляє статистику, і якщо так, то чому? Просто для того, щоб причинний висновок звучав більше, ніж є? Ви вважаєте, що причинно-наслідковий висновок - це Революція з великим R, яка дійсно змінює все наше мислення?

Редагувати:

Наведені вище запитання - це моє головне питання, але оскільки вони, правда кажучи, впевнені, будь ласка, дайте відповідь на ці конкретні запитання (1) у чому сенс "революції причинного зв'язку"? (2) чим вона відрізняється від "православної" статистики?

1. Також тому, що він такий скромний хлопець.
2. Я маю на увазі в науковому, а не статистичному сенсі.

EDIT : Ендрю Гелман написав цю публікацію в блозі на книзі Джудея Перлів, і я думаю, що він зробив набагато кращу роботу, пояснивши мої проблеми з цією книгою, ніж я. Ось дві цитати:

На сторінці 66 книги Перл і Макензі пишуть, що статистика "стала модельним підприємством для зменшення даних". Привіт! Про що, чорт, ти говориш ?? Я статистик, займаюся статистикою протягом 30 років, працюючи в сферах, починаючи від політики і закінчуючи токсикологією. «Зниження даних за допомогою наосліп»? Це просто фігня. Ми постійно використовуємо моделі.

І ще один:

Подивіться. Я знаю про плюралістичну дилему. З одного боку, Перл вважає, що його методи кращі за все, що було раніше. Чудово. Для нього та для багатьох інших вони найкращі інструменти для вивчення причинного висновку. У той же час, як плюраліст, або студент наукової історії, ми розуміємо, що існує багато способів спекти торт. Складно проявляти повагу до підходів, які для вас насправді не працюють, і в якийсь момент єдиний спосіб зробити це - відступити назад і усвідомити, що реальні люди використовують ці методи для вирішення реальних проблем. Наприклад, я вважаю, що прийняття рішень з використанням p-значень - це жахлива і логічно невідповідна ідея, яка призвела до безлічі наукових катастроф; в той же час багатьом ученим вдається використовувати р-значення як інструменти для навчання. Я це визнаю. Аналогічно Я рекомендую Перлу визнати, що апарат статистики, ієрархічне моделювання регресії, взаємодії, постстратифікація, машинне навчання тощо тощо вирішує реальні проблеми причинного висновку. Наші методи, як Перл, можуть також зіпсувати - GIGO! - І, можливо, Перл має рацію, що нам усім краще перейти до його підходу. Але я не думаю, що це допомагає, коли він видає неточні твердження про те, що ми робимо.


41
Лінійна регресія не є причинною моделлю. Проста лінійна регресія така ж, як попарна кореляція, єдина відмінність - стандартизація . Отже, якщо ви говорите, що регресія є причиною, то те саме має бути справедливим і для кореляції. Чи є кореляційна причинно-наслідкова зв’язок? Ви можете використовувати регресію для передбачення будь-яких, нісенітницьких відносин між будь-якими довільними змінними (з випадком безлічі "значущих" результатів).
Тім

8
Суперечності, щодо яких підхід до міркувань щодо причинності в статистиці має найбільше достоїнств між Перлом, Рубіном, Гекманом та іншими, здається, погіршилися, і я вважаю, що тон Перла стає все більш сміливим. Не дозволяйте це відволікати вас від щирого розуміння, яке він може запропонувати. Прочитайте його попередню книгу Причинність, вона менше потрапить під вашу шкіру.
CloseToC

7
@CloseToC Я додам, що Перл, Рубін та Гекман, таким чином, усі працюють в одних і тих же рамках (тобто, логічно еквівалентні рамки, див. Тут stats.stackexchange.com/questions/249767/… ), тож їхні суперечки полягають у різному рівень від аргументації речей на кшталт "лінійна регресія є причинною моделлю".
Карлос Сінеллі

9
Мене сама книга дратувала. Там є декілька просто помилкових статистичних тверджень (не можу сказати, що книга з моїми записками на полях є вдома), які змусили мене замислитися, чи лише журналіст, який допоміг Перле написати книгу, або також сам Перл був поганим статистиком. (Потрібно говорити, що я був дуже здивований, коли виявив такі кричущі помилки у роботі такого шанованого вченого.) Його роботи набагато кращі, хоча навіть там ніхто не звинуватить Перла за скромність ...
Річард Харді

15
У мене є певне занепокоєння, що ця нитка вже заплутується разом (а) конкретна книга дуже розумної людини (б) ця особа розумної людини та стиль дискусії (в) чи правильна, перебільшена чи будь-яка інша точка зору.
Нік Кокс

Відповіді:


59

Я повністю погоджуюся, що тон Перла зарозумілий, а його характеристика «статистиків» спрощена та монолітна. Крім того, я не вважаю його написання особливо чітким.

Однак, я думаю, у нього є пункт.

Причинно-наслідкові міркування не були частиною моєї формальної підготовки (MSc): найближчим моїм питанням був факультативний курс експериментального проектування, тобто будь-які претензії щодо причинності вимагали від мене фізичного контролю навколишнього середовища. Книга Перла Причинність була моїм першим викриттям спростування цієї ідеї. Очевидно, що я не можу виступати за всіх статистиків та навчальних програм, але з моєї власної точки зору я підписуюся на спостереження Перла, що причинно-наслідкові міркування не є пріоритетним у статистиці.

Це правда, що статистики іноді контролюють більше змінних, ніж це суворо необхідно, але це рідко призводить до помилок (принаймні, на мій досвід).

Це також переконання, яке я мав після закінчення магістратури зі статистики в 2010 році.

Однак це глибоко некоректно. Коли ви контролюєте загальний ефект (у книзі його називають "коллайдер"), ви можете ввести зміщення вибору. Це усвідомлення мене дуже вразило, і справді переконало мене в корисності представлення моїх причинних гіпотез як графіків.

EDIT: Мене попросили детальніше розібратися у змісті відбору. Ця тема досить тонка, я настійно рекомендую ознайомитись з edX MOOC на причинних діаграмах , дуже приємне вступ до графіків, в яких є розділ, присвячений зміщенню вибору.

На прикладі іграшки перефразовуючи цей документ, цитований у книзі: Розгляньте змінні A = привабливість, B = краса, C = компетентність. Припустимо, що B і C причинно не пов’язані між загальною сукупністю (тобто краса не викликає компетентності, компетентність не спричиняє красу, а краса та компетентність не поділяють загальної причини). Припустимо також, що будь-якого з B або C достатньо, щоб бути привабливим, тобто A є колайдером. Умови на A створюють хибну асоціацію між B і C.

Більш серйозним прикладом є "парадокс ваги при народженні", згідно з яким куріння матері (S) під час вагітності, здається, знижує смертність (M) дитини, якщо дитина не має ваги (U). Пропоноване пояснення полягає в тому, що вроджені вади (D) також спричиняють низьку вагу при народженні, а також сприяють смертності. Відповідна причинно-наслідкова діаграма - {S -> U, D -> U, U -> M, S -> M, D -> M}, в якій U - колайдер; кондиціонування на ньому вводить хибну асоціацію. Інтуїція, що стоїть за цим, полягає в тому, що якщо мати є курцем, низька вага при народженні рідше буде пов’язаний з дефектом.


8
+1. Чи можете ви трохи детальніше розглянути, як вона вносить ухили відбору? Можливо, трохи конкретний приклад дасть зрозуміти більшості читачів.
амеба

2
Дякуємо за редагування Це дуже чіткі приклади.
амеба

Отже, інтуїція для низької ваги при народженні немовлят курців - правильна, правда?
Маладі

@Malandy: ця модель узгоджується з даними та має інтуїтивний сенс. Я не знаю, чи правильно це.
mitchus


71

Ваше саме запитання відображає те, що говорить Перл!

проста лінійна регресія по суті є причинною моделлю

Y,Х,ZЕ[YХ]Е[ХY]Е[YХ,Z]Е[ZY,Х]

Лінійне структурне рівняння, з іншого боку, є причинною моделлю. Але перший крок - зрозуміти різницю між статистичними припущеннями (обмеження спостережуваного спільного розподілу ймовірностей) та причинними припущеннями (обмеження причинної моделі).

ви вважаєте, що Юдея Перл неправильно представляє статистику, і якщо так, то чому?

Ні, я не думаю, що ми бачимо ці помилки щодня. Звичайно, Перл робить деякі узагальнення, оскільки деякі статистики працюють з причинним висновком (Дон Рубін був піонером у просуванні потенційних результатів ... також я статистик!). Але він вірно стверджує, що основна частина традиційної освіти статистики уникає причинності навіть для того, щоб офіційно визначити, що таке причинний ефект.

YХЕ[Y|Х] Е[Yх]Е[Y|го(х)]

Цитата, яку ви приводите з книги, також є чудовим прикладом. У традиційних книгах зі статистикою ви не знайдете правильного визначення того, що таке учасник, ні настанов про те, коли слід (або не слід) налаштовуватися на коваріат у спостережних дослідженнях. Загалом, ви бачите "кореляційні критерії", наприклад, "якщо коваріат пов'язаний з лікуванням та результатом, слід скоригувати його". Один із найпомітніших прикладів цієї плутанини виявляється в Парадоксі Сімпсона - коли ви стикаєтесь з двома оцінками протилежних знаків, якими слід скористатися, скоригованими чи непристосованими? Відповідь, звичайно, залежить від причинно-наслідкової моделі.

І що означає Перл, коли каже, що це питання було закінчено? У випадку простого регулювання за допомогою регресії він посилається на критерій заднього кузова (докладніше див. Тут) . А для ідентифікації взагалі --- поза простого коригування --- він означає, що тепер у нас є цілісні алгоритми ідентифікації причинних наслідків для будь-якого даного напівмарківського DAG.

Ще одне зауваження тут варто зробити. Навіть в експериментальних дослідженнях - де традиційна статистика, безумовно, зробила багато важливої ​​роботи з розробкою експериментів! - зрештою, вам все одно потрібна причинно-наслідкова модель . Експерименти можуть страждати від невідповідності, від втрати спостереження, від упередженості відбору ... також, більшу частину часу ви не хочете обмежувати результати своїх експериментів конкретною аналізованою сукупністю, ви хочете узагальнити свої експериментальні результати для широкої / іншої групи населення. Тут знову можна запитати: для чого слід скоригуватися? Чи достатньо даних та предметних знань, щоб дозволити таку екстраполяцію? Все це - причинно-наслідкові поняття, тому вам потрібна мова, щоб офіційно висловити причинно-наслідкові припущення та перевірити, чи достатньо їх, щоб дозволити робити те, що ви хочете!

Підсумовуючи, ці помилки широко поширені в статистиці та економетриці, тут є декілька прикладів у перехресній валідації, таких як:

Та багато іншого.

Ви вважаєте, що причинно-наслідковий висновок - це Революція з великим R, яка дійсно змінює все наше мислення?

Враховуючи сучасний стан справ у багатьох науках, наскільки ми просунулися і як швидко змінюються речі, і скільки ми ще можемо зробити, я б сказав, що це справді революція.

PS : Перл запропонував два своїх дописи в блозі про привітність UCLA, які будуть цікаві для цієї дискусії, ви можете знайти їх тут і тут .

PS 2 : Як згадував Січень у своїй новій редакції, Ендрю Гельман має новий пост у своєму блозі. Окрім дебатів у блозі Гельмана, Перл також відповів у Twitter (нижче):

Огляд Гельмана на #Bookofwhy повинен викликати інтерес, оскільки він представляє ставлення, яке паралізує широке коло дослідників статистики. Моя початкова реакція тепер розміщена на https://t.co/mRyDcgQtEc Пов'язані повідомлення:https://t.co/xUwR6eCGrZ таhttps://t.co/qwqV3oyGUy

- Іудея Перл (@yudapearl) 9 січня 2019 року


4
Дякую. Але - добре, пишучи спрощено, я можу обчислити E [X | Y] так само, як E [Y | X], але я можу записати X ← Y, а також X → Y в DAG. Так чи інакше, я повинен почати з наукової гіпотези чи моделі. Моя гіпотеза, моя модель - мій вибір. Той факт , що я можу зробити що - то не означає , що я повинен зробити це, це робить.
січня

3
@ Януар це не означає, що слід, справа тут лише в тому, щоб мати можливість чітко сформулювати те, що ви хочете оцінити (причинно-наслідковий показник), чітко сформулювати свої причинно-наслідкові припущення (чітко розрізняючи причинно-наслідкові та статистичні припущення), перевіряючи логічні наслідки цих причинних припущень і можливість зрозуміти, чи достатньо ваших причинно-наслідкових припущень + даних для відповіді на ваш запит.
Карлос Сінеллі

3
ХY

4
Я думаю, що так: не видається абсолютно несправедливим припустити, що ваш пересічний статистик, хоча, ймовірно, добре розбирається в причинному висновку контрольованих експериментів, і, безумовно, не загрожує плутати співвідношення з причинною причиною, може бути дещо хитким щодо причинного висновку від спостереження дані. Я вважаю, що останнім є контекст цитати (я не читав книгу), і це те, що деякі читачі цієї публікації можуть не сприймати.
Scortchi

5
@January Коротше кажучи, "коригування для коваріатів" не обов'язково означає, що ви усунули упередження в оцінках причинного ефекту з цих змінних.
Олексій

31

Я шанувальник написання Іудеї, і я читав «Причинність» (любов) і «Книгу чому» (як).

Я не відчуваю, що Юдея базує статистику. Важко почути критику. Але що ми можемо сказати про будь-яку людину чи сферу, яка не сприймає критики? Вони схильні від величі до поступливості. Ви повинні запитати: чи критика правильна, потрібна, корисна і чи пропонуються альтернативи? Відповідь на все це - рішуче "Так".

1

Потрібні? ЗМІ переповнені, здавалося б, суперечливими твердженнями про вплив основних впливів на здоров'я. Невідповідність аналізу даних є застоєм доказів, які не дають нам корисної політики, медичних процедур та рекомендацій щодо кращого життя.

Корисно? Коментар Юдеї є актуальним і досить конкретним, щоб дати паузу. Це безпосередньо стосується будь-якого аналізу даних, з яким може зіткнутися будь-який статистик або експерт з даних.

Чи пропонуються альтернативи? Так, Юдея насправді обговорює можливість вдосконалення статистичних методів і навіть те, як вони зводяться до відомих статистичних рамок (як, наприклад, моделювання структурних рівнянь) та їх зв'язку з регресійними моделями). Все зводиться до того, щоб вимагати чіткого викладу змістовних знань, що керували підходом моделювання.

Юдея не просто пропонує нам зневажити всі статистичні методи (наприклад, регресію). Швидше він говорить, що нам потрібно прийняти деяку причинно-наслідкову теорію для обгрунтування моделей.

1


3
Гарна відповідь. Зауважте, що не будучи статистиком, а слугувати інтерфейсом між статистикою та біологією протягом багатьох років, для мене будь-яку критику статистиків насправді не так важко чути ;-) Ти правда, ти справді вважаєш, що "православна статистика" не може впоратися з причинною причиною? взагалі, як прямо заявляє Перл?
січня

4
@January au contraire . Я думаю, що дефіцит статистиків у прийнятті причинного висновку в їхніх аналізах безпосередньо пов'язаний з їх дефіцитом у розумінні частолістського висновку. Це відсутність контрафактних міркувань.
АдамО

4
+1 «The" підстроювання "підхід полягає в виборі змінних , тому що вони були підібраний з DD як" корисний "" відношення "" важливо "або інший нонсенс , фактично включає формальні гіпотези про конкретні причинно - наслідкових зв'язків між ними ( а - ля формальне використання DAG) ". Редагування додано. :)
Олексій

Коментарі не для розширеного обговорення; ця розмова переміщена до чату .
Scortchi

23

Я не читав цієї книги, тому можу судити лише про конкретну цитату, яку ви даєте. Однак навіть на цій основі я погоджуюся з вами, що це здається вкрай несправедливим для статистичної професії. Насправді я думаю, що статистики завжди робили надзвичайно гарну роботу, підкреслюючи різницю між статистичними асоціаціями (кореляція тощо) та причинно-наслідкові зв’язки та попереджаючи проти плутанини обох. Дійсно, на мій досвід, статистики, як правило, є основною професійною силою, яка бореться проти всюдисущої плутанини між причиною та кореляцією. Відверто помилково (і практично наклеп) стверджувати, що статистики "... зовсім не люблять говорити про причинність". Я бачу, чому ви дратуєтесь, читаючи подібні зарозумілі підкови.

Я б сказав, що це досить звично для нестатистівякі використовують статистичні моделі, щоб погано розуміти взаємозв'язок статистичної асоціації та причинності. Деякі мають гарну наукову підготовку з інших галузей, і в цьому випадку вони також можуть бути добре обізнані з цим питанням, але, безумовно, є деякі люди, які використовують статистичні моделі, які погано розуміють ці питання. Це справедливо у багатьох прикладних наукових галузях, де практикуючі мають базову підготовку зі статистики, але не вивчають її на глибокому рівні. У цих випадках часто професійні статистики попереджають інших дослідників про відмінність між цими поняттями та їх належним співвідношенням. Статистики часто є ключовими конструкторами RCT та інших експериментів, що включають елементи контролю, що використовуються для виділення причинності. Їх часто закликають пояснити протоколи, такі як рандомізація, плацебо, та інші протоколи, які використовуються для спроби розірвати зв'язки з потенційними змішуючими змінними. Це правда, що іноді статистики контролюють більше змінних, ніж це суворо необхідно, але це рідко призводить до помилок (принаймні, на мій досвід). Я думаю, що більшість статистиків знають про різницю міжзамішання змінних та змінних колайдерів, коли вони роблять аналіз регресії з метою причинно-наслідкових висновків, і навіть якщо вони не завжди будують досконалі моделі, уявлення про те, що вони якимось чином ухиляються від розгляду причинності, просто смішно.

Я думаю, що Юдея Перл зробила дуже цінний внесок у статистику своєю роботою щодо причинності, і я вдячний йому за цей чудовий внесок. Він сконструював і вивчив деякі дуже корисні формалізми, які допомагають виділити причинно-наслідкові зв’язки, і його робота стала основним елементом хорошої статистичної освіти. Я читав його книгу Причинністьв той час як я був студентом ступеня, і це на моїй полиці, і на полицях багатьох інших статистиків. Значна частина цього формалізму перегукується з речами, які були інтуїтивно відомі статистикам ще до того, як вони були формалізовані в алгебраїчну систему, але це дуже важливо в будь-якому випадку і виходить за рамки очевидного. (Я насправді думаю, що в майбутньому ми побачимо злиття операції "робити" з алгеброю ймовірності, що відбувається на аксіоматичному рівні, і це, мабуть, з часом стане ядром теорії ймовірностей. Я хотів би бачити це вбудованим безпосередньо в статистичну освіту , щоб ви дізналися про причинно-наслідкові моделі та операцію "робити", коли дізнаєтесь про ймовірнісні заходи.)

Останнє, що слід пам’ятати тут, - це те, що існує багато застосувань статистики, де мета є прогностичною , коли практикуючий не прагне зробити висновок про причинність. Такі типи додатків надзвичайно поширені в статистиці, і в таких випадках важливо не обмежувати себе причинно-наслідковими зв’язками. Це справедливо в більшості застосувань статистики у галузі фінансів, HR, моделювання робочої сили та багатьох інших сферах. Не слід недооцінювати кількість контекстів, коли не можна чи не слід прагнути керувати змінними.


Оновлення: Я помічаю, що моя відповідь не відповідає тій, яку надав Карлос . Можливо, ми не погоджуємося з тим, що являє собою "статистик / економетрик, що має лише регулярне навчання". Кожен, кого я б назвав "статистиком", як правило, має принаймні освіту на рівні випускників і зазвичай має значну професійну підготовку / досвід. (Наприклад, в Австралії вимога стати "акредитованим статистиком" з нашим національним професійним органом вимагає як мінімум чотирьох років досвіду після здобуття диплома з відзнакою, або шість років досвіду після звичайного бакалавра.) У будь-якому випадку студента вивчення статистики не є статистиком .

Я зауважую, що як доказ нібито нерозуміння причинності статистиками відповідь Карлоса вказує на кілька запитань на CV.SE, які задають питання про причинність у регресії. У кожному з цих випадків запитання задає той, хто, очевидно, початківець (а не статистик), а відповіді, які дають Карлос та інші (які відображають правильне пояснення), є високообоснованими відповідями. Дійсно, у кількох випадках Карлос детально розповів про причинність, і його відповіді є найбільш високо оціненими. Це, безумовно, доводить, що статистики розуміють причинність .

Деякі інші плакати зазначають, що аналіз причинності часто не включається до навчальної програми зі статистикою. Це правда, і це велика ганьба, але більшість професійних статистиків - це не нещодавні випускники, і вони дізналися набагато більше того, що включено у стандартну магістерську програму. Знову ж таки, в цьому відношенні виявляється, що я маю вищу оцінку середнього рівня знань статистиків, ніж інші плакати.


12
Я нестатист, офіційне навчання статистики якого проводили нестатистики в тій же галузі, і я викладаю та досліджую нестатистики, які застосовують статистику. Я можу запевнити вас, що принцип, що (наприклад) кореляція не є причиною, є і був повторною мантрою в моєму полі. Дійсно, я не зустрічаю людей, які не бачать, що співвідношення між опадами та врожайністю пшениці - це не все, що потрібно сказати про взаємозв'язок між ними та основними процесами. Як правило, на мій досвід, нестатистичні лікарі теж давно так думали.
Нік Кокс

8
Як епідеміолог, я все більше і більше дратуюся цією мантрою. Як говорить @NickCox, це те, що розуміють навіть не вчені. Проблема в мене полягає в тому, що всі стрибають на прокладці "кореляція не означає причинного зв'язку!" щоразу, коли опубліковане спостережне дослідження (дослідження, яке стосується випадку, скажімо). Так, кореляція не означає причинно-наслідкового зв'язку, але дослідники, як правило, цілком усвідомлюють це, і зроблять усе, щоб розробити та проаналізувати дослідження таким чином, щоб причинно-наслідкове тлумачення було принаймні правдоподібним.
COOLSerdash

5
@ Nick Cox: Я відредагував, щоб більш точно сказати, що є багато нестатистів, які це добре розуміють. Я не мав наміру кидати дисперсії на інші професії - лише підкреслив, що це питання надзвичайно добре зрозуміло статистикам.
Бен

7
@ NickCox У внесках Перла про причинності набагато більше, ніж "кореляція - це не причинний зв'язок". Я з Карлосом тут. Досить зрозуміти про причинність, що це повинен бути цілий курс. Наскільки мені відомо, більшість відділів статистики не пропонують такого курсу.
Ніл Г

12
@Ben: Перл не звинувачує статистиків у плутанні кореляції та причинного зв'язку. Він звинувачує їх в тому, що вони в основному не відповідають причинним міркуванням. Я погоджуюся з вами, що його тон зарозумілий, але я думаю, що він має сенс.
mitchus

11

проста лінійна регресія по суті є причинною моделлю

Ось приклад, який я придумав, коли модель лінійної регресії виявляється непричинною. Скажімо апріорі, що препарат приймали в момент 0 ( t = 0 ) і що він не впливає на частоту інфарктів при t = 1 . Серцеві напади при t = 1 впливають на інфаркти при t = 2 (тобто попередні пошкодження роблять серце більш чутливим до пошкодження). Виживання при t = 3 залежить лише від того, чи не було у людей серцевого нападу при t = 2 - серцевий напад при t = 1 реально вплине на виживання при t = 3 , але у нас не буде стрілки заради простота

Ось легенда:

DAG легенда

Ось справжній причинний графік: зміщення колайдера

Зробимо вигляд, що ми не знаємо, що інфаркти при t = 1 не залежать від прийому препарату при t = 0, тому ми побудуємо просту модель лінійної регресії для оцінки впливу препарату на інфаркт при t = 0 . Ось наш провісник буде Drug т = 0 і наша змінна результат буде серцевий напад t = 1 . Єдині дані, які ми маємо - це люди, які виживають при t = 3 , тому ми будемо регресувати за цими даними.

Ось 95% достовірний інтервал Байєса для коефіцієнта препарату t = 0 : 95% надійний інтервал, зміщення колайдера

Значна частина ймовірностей, як ми бачимо, більша за 0, тому, схоже, є ефект! Однак ми апріорі знаємо, що є 0 ефект. Математика причинно-наслідкового зв’язку, розроблена Джудеєю Перл та іншими, значно полегшує переконання, що в цьому прикладі буде упередженість (за рахунок кондиціонування на нащадку колайдера). Робота Юдеї передбачає, що в цій ситуації ми повинні використовувати повний набір даних (тобто не дивитись на людей, які тільки вижили), які видалять упереджені шляхи:

немає упередженості

Ось 95% достовірний інтервал під час перегляду повного набору даних (тобто не обумовлення тих, хто вижив).

95% надійний інтервал, без упереджень.

Він щільно зосереджений у 0, що по суті не виявляє жодної асоціації.

На прикладах із реального життя все може бути не таким простим. Можливо, буде ще багато змінних, які можуть спричинити систематичне зміщення (заплутаність, зміщення вибору тощо). Чому слід підкоригуватись в аналізах, він математизував Перл; алгоритми можуть підказувати, для якої змінної слід скоригуватися, або навіть сказати нам, коли коригування недостатньо для усунення систематичного зміщення. Завдяки цій формальній теорії нам не потрібно витрачати стільки часу, сперечаючись про те, для чого слід підлаштовуватися, а для чого не підходити; ми можемо швидко дійти висновків щодо того, чи є наші результати надійними чи ні. Ми можемо краще спроектувати свої експерименти, простіше аналізувати дані спостережень.

Ось безкоштовний онлайн-курс з причинних DAGs Мігеля Ернана. У ньому є маса практичних прикладів, в яких професори / вчені / статистики дійшли протилежних висновків з цього питання. Деякі з них можуть здатися парадоксами. Однак ви можете їх легко вирішити за допомогою d-поділу і критерії зворотного доступу Judea Pearl .

Для довідки, ось код процесу генерації даних та код для достовірних інтервалів, показаних вище:

import numpy as np
import pandas as pd
import statsmodels as sm
import pymc3 as pm
from sklearn.linear_model import LinearRegression

%matplotlib inline

# notice that taking the drug is independent of heart attack at time 1.
# heart_attack_time_1 doesn't "listen" to take_drug_t_0
take_drug_t_0 = np.random.binomial(n=1, p=0.7, size=10000)
heart_attack_time_1 = np.random.binomial(n=1, p=0.4, size=10000)

proba_heart_attack_time_2 = []

# heart_attack_time_1 increases the probability of heart_attack_time_2. Let's say
# it's because it weakens the heart and makes it more susceptible to further
# injuries
# 
# Yet, take_drug_t_0 decreases the probability of heart attacks happening at
# time 2
for drug_t_0, heart_attack_t_1 in zip(take_drug_t_0, heart_attack_time_1):
    if drug_t_0 == 0 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 1 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 0 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.5)
    elif drug_t_0 == 1 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.05)

heart_attack_time_2 = np.random.binomial(
    n=2, p=proba_heart_attack_time_2, size=10000
)

# people who've had a heart attack at time 2 are more likely to die by time 3

proba_survive_t_3 = []
for heart_attack_t_2 in heart_attack_time_2:
    if heart_attack_t_2 == 0:
        proba_survive_t_3.append(0.95)
    else:
        proba_survive_t_3.append(0.6)

survive_t_3 = np.random.binomial(
    n=1, p=proba_survive_t_3, size=10000
)

df = pd.DataFrame(
    {
        'survive_t_3': survive_t_3,
        'take_drug_t_0': take_drug_t_0,
        'heart_attack_time_1': heart_attack_time_1,
        'heart_attack_time_2': heart_attack_time_2
    }
)

# we only have access to data of the people who survived
survive_t_3_data = df[
    df['survive_t_3'] == 1
]

survive_t_3_X = survive_t_3_data[['take_drug_t_0']]

lr = LinearRegression()
lr.fit(survive_t_3_X, survive_t_3_data['heart_attack_time_1'])
lr.coef_

with pm.Model() as collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * survive_t_3_data['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=survive_t_3_data['heart_attack_time_1']
    )

    collider_bias_normal_trace = pm.sample(2000, tune=1000)

pm.plot_posterior(collider_bias_normal_trace['take_drug_t_0'])

with pm.Model() as no_collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * df['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=df['heart_attack_time_1']
    )

    no_collider_bias_normal_trace = pm.sample(2000, tune=2000)

pm.plot_posterior(no_collider_bias_normal_trace['take_drug_t_0'])

4

Два документи, другий класичний, які допомагають (я думаю) пролити додаткові вогні на точки Юдеї та цю тему загалом. Це відбувається від того, хто неодноразово використовував SEM (це кореляція та регресія) і резонує з його критикою:

https://www.sciencedirect.com/science/article/pii/S0022103111001466

http://psycnet.apa.org/record/1973-20037-001

Документи, по суті, описують, чому кореляційні моделі (регресія) звичайно не можна сприймати як такі, що передбачають якісь сильні причинно-наслідкові умовиводи. Будь-яка закономірність асоціацій може відповідати заданій матриці коваріації (тобто, не вказуючи напрямок та зв'язок між змінними). Звідси необхідність таких речей, як експериментальна конструкція, зустрічні факти тощо. Це стосується навіть тих випадків, коли у них є часова структура їхніх даних, де передбачувана причина виникає в часі до передбачуваного ефекту.


1

"... оскільки ми по суті припускаємо, що одна змінна є причиною, а інша - ефектом (отже, кореляція відрізняється підходом від регресійного моделювання) ..."

Регресійне моделювання, безумовно, НЕ робить цього припущення.

"... і перевірка, чи пояснює цей причинно-наслідковий зв'язок спостережувані закономірності."

Якщо ви припускаєте причинність і підтверджуєте її порівнянні зі спостереженнями, ви робите моделювання SEM, або те, що Pearl назвав би моделюванням SCM. Хочете чи не хочете називати цю частину домену статистики дискусійним. Але я думаю, що більшість не називатиме це класичною статистикою.

Замість того, щоб загадувати статистику взагалі, я вважаю, що Перл просто критикує схильність статистиків до вирішення причинної семантики. Він вважає це серйозною проблемою через те, що Карл Саган називає феноменом "заходьте і виходьте", де ви відмовляєтесь від дослідження, яке говорить про те, що "споживання м'яса" сильно пов'язане "із підвищенням лібідо, p <0,05", а потім кланяється, знаючи цілком ці два результати будуть причинно пов'язані у свідомості громадськості.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.