Статистика та причинний висновок?


51

У своїй доповіді 1984 р. "Статистика і причинно-наслідкові умовиводи" Пол Голланд підняв одне з найбільш фундаментальних питань статистики:

Що може сказати статистична модель про причинно-наслідкові зв’язки?

Це призвело до його девізу:

БЕЗ ПРИЧИНИ НЕ БУДУВАННЯ

що підкреслювало важливість обмежень навколо експериментів, які вважають причиною. Ендрю Гельман робить подібний момент :

"Щоб дізнатися, що відбувається, коли щось зміниш, потрібно це змінити." ... Є речі, які ти дізнаєшся від збурень системи, про які ти ніколи не дізнаєшся з жодної кількості пасивного спостереження.

Його ідеї узагальнені в цій статті .

Які міркування слід враховувати, роблячи причинний висновок із статистичної моделі?


2
чудове запитання: дивіться також це пов’язане питання щодо кореляції та причинно-наслідкової статистики.stackexchange.com
questions/534/


5
Багато чого сказати. Але ви можете прочитати книгу Перла "Причинність" (2002, але новіше 2-е видання) або книгу Ернана та Робінса "Висновок причин" (2015, безкоштовний електронний проект в Інтернеті, якщо шукати).

Відповіді:


28

Це питання широке, але враховуючи, що цитата "Коробка, Мисливець та Мисливець" - це правда, я думаю, що це зводиться до

  1. Якість експериментальної конструкції:

    • рандомізація, розміри вибірки, контроль змішувачів, ...
  2. Якість виконання дизайну:

    • дотримання протоколу, помилка вимірювання, обробка даних, ...
  3. Якість моделі, щоб точно відобразити дизайн:

    • Блокуючі структури точно представлені, належні ступені свободи пов'язані з ефектами, оцінки непідвладні, ...

Ризикуючи сказати очевидним, я спробую потрапити на ключові моменти кожного:

  1. це велике підполе статистики, але в його найбільш базовій формі я думаю, що це зводиться до того, що при здійсненні причинного висновку ми в ідеалі починаємо з ідентичних одиниць, які відслідковуються в ідентичних середовищах, окрім як призначених для лікування. Будь-які систематичні відмінності між групами після призначення препарату потім логічно відносяться до лікування (ми можемо зробити висновок про причину). Але світ не такий приємний, і одиниці відрізняються перед лікуванням, а довкілля під час експериментів не контролюється ідеально. Таким чином, ми «контролюємо те, що можемо, і рандомізуємо те, що не можемо», що допомагає гарантувати, що не буде систематичної упередженості через конфузів, які ми контролювали чи рандомізували. Одна з проблем полягає в тому, що експерименти, як правило, є складними (неможливими) і дорогими, і розроблено велику різноманітність конструкцій, щоб ефективно витягти якомога більше інформації в максимально ретельно контрольованих умовах, враховуючи витрати. Деякі з них досить жорсткі (наприклад, у медицині подвійне сліпе, рандомізоване, плацебо-контрольоване дослідження), а інші - не так (наприклад, різні форми «квазіекспериментів»).

  2. також є великим питанням, про яке статистики взагалі не думають ... хоч і слід. У застосованій статистичній роботі я можу згадати випадки, коли «ефекти», виявлені в даних, були хибними результатами невідповідності збору або обробки даних. Мені також цікаво, як часто інформація про справжні причинно-наслідкові наслідки інтересу втрачається через ці питання (я вважаю, що студенти прикладних наук, як правило, мало навчаються про способи пошкодження даних - але я переходжу до теми тут ...)

  3. - це ще один великий технічний предмет і ще один необхідний крок у об'єктивному причинному висновку. Певною мірою це переймається тим, що натовп дизайнерів розробляє проекти та моделі разом (оскільки висновок з моделі - мета, атрибути проектувальних приводів). Але це досягає нас поки що, оскільки в "реальному світі" ми аналізуємо експериментальні дані з не-підручників, і тоді нам доводиться добре замислюватися над такими речами, як відповідні елементи управління та те, як вони мають увійти в модель та які пов'язані ступені Свобода повинна бути і чи виконуються припущення, якщо ні, як відрегулювати порушення та наскільки надійні оцінювачі до будь-яких інших порушень та ...

У будь-якому випадку, сподіваємось, деякі з перерахованих вище допомагають думати про міркування щодо прийняття причинного висновку з моделі. Я забув щось велике?


3
Величезний плюс один за балом 2. Крім того, щоб пройти навчання з питань захисту людини, я ніколи не проходив найменшого тренінгу щодо збору та зберігання даних. Правильне збирання даних набагато важливіше, ніж аналіз.
Метт Паркер

Я теж хотів би відповісти, але боюся, що нічого не залишилося додати до того, що сказав Кінгсфорд.
Joris Meys

7

Окрім відмінної відповіді вище, є статистичний метод, який може наблизити вас до демонстрації причинності. Саме Грінгер-каузальність демонструє, що одна незалежна змінна, що виникає перед залежною змінною, має причинний ефект чи ні. Я впроваджую цей метод у легкій для подання презентації за наступним посиланням:

http://www.slideshare.net/gaetanlion/granger-causality-presentation

Я також застосовую цей метод для тестування конкуруючих макроекономічних теорій: http://www.slideshare.net/gaetanlion/economic-theory-testing-presentation

Майте на увазі, що цей метод не є ідеальним. Це просто підтверджує, що певні події відбуваються перед іншими, і, здається, ці події мають послідовний спрямований взаємозв'язок. Це, мабуть, тягне за собою справжню причинність, але це не завжди так. Ранковий дзвінок півня не викликає схід сонця.


4

Що може сказати статистична модель про причинно-наслідкові зв’язки? Які міркування слід враховувати, роблячи причинний висновок із статистичної моделі?

Перше, що слід зрозуміти, це те, що не можна робити причинно-наслідкові умови з чисто статистичної моделі. Жодна статистична модель не може сказати нічого про причинно-наслідкові зв’язки без причинних припущень. Тобто для здійснення причинного висновку потрібна причинно-наслідкова модель .

ZХY

введіть тут опис зображення

P(Y|do(X))=P(Y|X)XY

введіть тут опис зображення

Х

Це може стати ще складнішим. У вас можуть виникнути проблеми з помилками вимірювання, суб'єкти можуть відмовитися від дослідження або не дотримуватися інструкцій, серед інших питань. Вам потрібно буде зробити припущення про те, як ці речі пов'язані з тим, щоб виходити з висновком. З "чисто" даними спостереження це може бути більш проблематичним, оскільки зазвичай дослідники не матимуть гарного уявлення про процес формування даних.

Отже, щоб робити причинно-наслідкові умовиводи з моделей, потрібно судити не лише про його статистичні припущення, а головне про його причинно-наслідкові припущення. Ось деякі поширені загрози для причинного аналізу:

  • Неповні / неточні дані
  • Цільова причинно-наслідкова кількість, яка не визначена (Який причинний ефект, який ви хочете визначити? Яка цільова сукупність?)
  • Блудність (непомічені плутанини)
  • Відхилення відбору (самовідбір, усічені зразки)
  • Помилка вимірювання (що може спричинити заплутаність, а не лише шум)
  • Неправильне визначення (наприклад, неправильна функціональна форма)
  • Проблеми із зовнішньою дійсністю (неправильний висновок до цільової сукупності)

Іноді претензія про відсутність цих проблем (або претензія на вирішення цих проблем) може бути підкріплена самою розробкою дослідження. Ось чому експериментальні дані зазвичай є більш достовірними. Однак іноді люди припускатимуть ці проблеми або теоретично, або для зручності. Якщо теорія буде м'якою (як у соціальних науках), важче буде зробити висновки за номіналом.

Щоразу, коли ви думаєте, що існує припущення, яке неможливо зробити резервним, слід оцінити, наскільки чутливі висновки щодо правдоподібних порушень цих припущень - це зазвичай називають аналізом чутливості.


Чи було б рівнозначно замінити пунктирну двонаправлену стрілку двома однонаправленими суцільними стрілками з додаткового вузла?
Тейлор

@Taylor так, прихований (непомічений) додатковий вузол.
Карлос Сінеллі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.