Я читаю книгу Юдеї Перли, чому вона потрапляє мені під шкіру 1 . Зокрема, мені здається, що він беззастережно базується на "класичній" статистиці, висуваючи солом'яний аргумент що статистика ніколи, ніколи не може досліджувати причинно-наслідкові зв'язки, що її ніколи не цікавлять причинно-наслідкові відносини, і що статистика "стала моделлю - підприємство з скороченням даних ". Статистика стає некрасивим словом у його книзі.
Наприклад:
Статистики були дуже заплутані щодо того, які змінні слід і не слід контролювати, тому практика за замовчуванням полягала в тому, щоб контролювати все, що можна виміряти. [...] Це зручна, проста процедура, яку слід дотримуватися, але вона є і марною, і помиляється помилками. Ключовим досягненням Причинної революції було припинення цієї плутанини.
У той же час, статистики сильно недооцінюють контролінг у тому сенсі, що вони взагалі нелюбові говорити про причинність [...]
Однак причинно-наслідкові моделі були в статистиці, як, назавжди. Я маю на увазі, що регресійну модель можна використовувати по суті причинно-наслідкової моделі, оскільки ми по суті припускаємо що одна змінна є причиною, а інша - ефектом (отже, кореляція відрізняється підходом від регресійного моделювання) і перевіряє, чи пояснює цей причинний зв’язок спостережувані закономірності .
Ще одна цитата:
Недарма статистики, зокрема, вважали цю загадку [проблемою Монті Холла] важкою для розуміння. Вони звикли, як висловлювався Р. А. Фішер (1922), "зменшенням даних" і ігноруванням процесу генерації даних.
Це нагадує мені відповідь, яку Ендрю Гельман написав до відомого мультфільму xkcd про байесів і частотантів: "Все-таки я вважаю, що мультфільм в цілому несправедливий, оскільки він порівнює розумного байесівця з частою статистикою, яка сліпо слідує порадам дрібних підручників . "
Кількість хибного викладу s-слова, яке, як я його сприймаю, існує в книзі Judea Pearls, змусило мене замислитись, чи не є сумнівним причинний висновок (який я досі сприймав як корисний та цікавий спосіб організації та перевірки наукової гіпотези 2 ).
Запитання: чи вважаєте ви, що Юдея Перл неправильно представляє статистику, і якщо так, то чому? Просто для того, щоб причинний висновок звучав більше, ніж є? Ви вважаєте, що причинно-наслідковий висновок - це Революція з великим R, яка дійсно змінює все наше мислення?
Редагувати:
Наведені вище запитання - це моє головне питання, але оскільки вони, правда кажучи, впевнені, будь ласка, дайте відповідь на ці конкретні запитання (1) у чому сенс "революції причинного зв'язку"? (2) чим вона відрізняється від "православної" статистики?
1. Також тому, що він такий скромний хлопець.
2. Я маю на увазі в науковому, а не статистичному сенсі.
EDIT : Ендрю Гелман написав цю публікацію в блозі на книзі Джудея Перлів, і я думаю, що він зробив набагато кращу роботу, пояснивши мої проблеми з цією книгою, ніж я. Ось дві цитати:
На сторінці 66 книги Перл і Макензі пишуть, що статистика "стала модельним підприємством для зменшення даних". Привіт! Про що, чорт, ти говориш ?? Я статистик, займаюся статистикою протягом 30 років, працюючи в сферах, починаючи від політики і закінчуючи токсикологією. «Зниження даних за допомогою наосліп»? Це просто фігня. Ми постійно використовуємо моделі.
І ще один:
Подивіться. Я знаю про плюралістичну дилему. З одного боку, Перл вважає, що його методи кращі за все, що було раніше. Чудово. Для нього та для багатьох інших вони найкращі інструменти для вивчення причинного висновку. У той же час, як плюраліст, або студент наукової історії, ми розуміємо, що існує багато способів спекти торт. Складно проявляти повагу до підходів, які для вас насправді не працюють, і в якийсь момент єдиний спосіб зробити це - відступити назад і усвідомити, що реальні люди використовують ці методи для вирішення реальних проблем. Наприклад, я вважаю, що прийняття рішень з використанням p-значень - це жахлива і логічно невідповідна ідея, яка призвела до безлічі наукових катастроф; в той же час багатьом ученим вдається використовувати р-значення як інструменти для навчання. Я це визнаю. Аналогічно Я рекомендую Перлу визнати, що апарат статистики, ієрархічне моделювання регресії, взаємодії, постстратифікація, машинне навчання тощо тощо вирішує реальні проблеми причинного висновку. Наші методи, як Перл, можуть також зіпсувати - GIGO! - І, можливо, Перл має рацію, що нам усім краще перейти до його підходу. Але я не думаю, що це допомагає, коли він видає неточні твердження про те, що ми робимо.