Різниця між перемичками два та три в Сходи причинності


12

У «Книзі Чому» Юдеї Перл він розповідає про те, що він називає «Сходами причинності», що по суті є ієрархією, що складається з різних рівнів причинно-наслідкових міркувань. Найнижча стосується моделей асоціації спостережуваних даних (наприклад, кореляція, умовна ймовірність тощо), наступна фокусується на втручанні (що відбувається, якщо ми навмисно змінимо процес генерування даних певним чином?), А третій - контрфактичний (що буде в іншому можливому світі, якби щось сталося чи не сталося)?

Чого я не розумію - це те, чим відрізняються міжряддя два та три. Якщо ми задаємо контрфактичне запитання, чи не просто ми ставимо питання про втручання, щоб звести нанівець якийсь аспект світу, що спостерігається?


Це справді на тему? Запитуючи цікавість
Firebug

5
@Firebug - це причинність на тему? Якщо ви хочете обчислити ймовірність контрафакту (наприклад, ймовірність того, що конкретного препарату було достатньо для чиєїсь смерті), вам потрібно це зрозуміти.
Карлос Сінеллі

Відповіді:


13

Не існує суперечності між фактичним світом та дією, що цікавить інтервенційний рівень. Наприклад, куріння до сьогодні та змушення кинути палити починаючи з завтрашнього дня не суперечать один одному, хоча ви можете сказати, що одне «заперечує» інше. Але тепер уявіть собі наступний сценарій. Ви знаєте Джо, що палить все життя, у якого рак легенів, і вам цікаво: а якби Джо не курив тридцять років, він був би сьогодні здоровим? У цьому випадку ми маємо справу з однією і тією ж людиною, одночасно уявляючи сценарій, коли дія і результат прямо суперечать відомим фактам.

Таким чином, головна відмінність втручань і контрафактів полягає в тому, що, хоча в ході втручань ви запитуєте, що буде в середньому, якщо ви будете робити дію, у контрафактів ви запитуєте, що б сталося, якби ви прийняли інший курс дій у конкретній ситуації , враховуючи, що у вас є інформація про те, що сталося насправді.Зауважте, що, оскільки ви вже знаєте, що сталося в реальному світі, вам потрібно оновити свою інформацію про минуле з урахуванням ваших доказів.

Ці два типи запитів математично відрізняються, оскільки вони вимагають відповіді різного рівня інформації (зустрічним факторам потрібно відповідати більше інформації) та ще більш досконалою мовою, щоб бути сформульованою !.

З інформацією, необхідною для відповіді на запитання Rung 3, ви можете відповісти на питання Rung 2, але не навпаки. Точніше, ви не можете відповісти на зустрічні факти просто інформаційною інтервенцією. Приклади, коли відбувається зіткнення втручань та контрфактиків, вже були наведені тут у резюме, дивіться цей пост та цей пост . Однак заради повноти я наведу і приклад.

Приклад нижче можна знайти в Причинності, розділ 1.4.4.

х=1х=0у=0у=1П(у|х)=0,5   х,у .

П(Y=1|го(Х=1))-П(Y=1|го(Х=0)=0

П(Y0=0|Х=1,Y=1)

На це запитання не можна відповісти лише завдяки наявним вами інтервенційним даним. Доказ простий: я можу створити дві різні причинно-наслідкові моделі, які матимуть однакові інтервенційні розподіли, але різні контрфактичні розподіли. Два наведені нижче:

введіть тут опис зображення

UП(у,х) обох моделей узгоджується.

Зауважте, що в першій моделі на лікування ніхто не постраждав, тому відсоток тих пацієнтів, які померли під час лікування, які одужали б, якби вони не прийняли лікування, дорівнює нулю.

Однак у другій моделі на лікування впливає кожен пацієнт, і ми маємо суміш з двох груп, у яких середній причинний ефект виявляється нульовим. У цьому прикладі кількість контрафактної кількості зараз становить 100% --- у моделі 2, всі пацієнти, які померли під час лікування, одужали б, якби вони не брали лікування.

Таким чином, існує чітке розмежування кроку 2 і перегону 3. Як показано в прикладі, ви не можете відповідати на зустрічні факти, просто за допомогою інформації та припущень щодо втручань. Це стає зрозумілим за допомогою трьох кроків для обчислення зустрічної факти:

  1. П(у)П(у|е)
  2. го(х))
  3. Y

Це неможливо обчислити без деякої функціональної інформації про причинну модель або без деякої інформації про прихованих змінних.


Цікава відповідь! Пару подальших дій: 1) Ви говорите " З інформацією про Rung 3 ви можете відповісти на питання Rung 2, але не навпаки ". Але у вашому прикладі куріння я не розумію, наскільки знаючи, чи буде Джо здоровим, якби він ніколи не курив, відповідає на питання "Чи був би він здоровим, якщо завтра кине завтра після 30 років куріння". Вони здаються виразними питаннями, тому я думаю, що мені чогось не вистачає.
mkt - Відновіть Моніку

Крім того, ваш наступний відпрацьований приклад покладається на 2 непомічених змінних, які випадково розподіляються між лікуванням та контролем. Але ви описали це як рандомізований експеримент - так це не у випадку поганої рандомізації? При правильній рандомізації я не бачу, як ви отримуєте два такі різні результати, якщо я не пропускаю чогось основного.
mkt - Відновіть Моніку

@mkt від останнього до першого. Неспостережна змінна розподіляється випадковим чином між лікуваними та контрольними, у вас рівно 50% кожної категорії u в обох руках. Під інформацією ми маємо на увазі часткову специфікацію моделі, необхідної для відповіді на зустрічні запити взагалі, а не відповідь на конкретний запит. Для відповіді на зустрічні запити вам потрібна причинно-наслідкова структура + деяка функціональна інформація або інформація про розподіл прихованих змінних.
Карлос Сінеллі

0

Ось відповідь, яку Юдея Перл дала на Twitter :

Читачі запитують: Чому втручання (Rung-2) відрізняється від зустрічного (Rung-3)? Чи не втручання заперечує деякі аспекти спостережуваного світу?

Відповідь Втручання змінюються, але не суперечать спостережуваному світу, оскільки світ до і після втручання тягне за собою змінні часу. Навпаки, "Якби я був мертвий" суперечить відомим фактам. Про недавню дискусію дивіться у цій дискусії .

Зауваження: і Гарвардська група # Causalinference, і Рубін потенційні рамки результатів не відрізняють Rung-2 від Rung-3.

Я вважаю, що це культурологічний опір, який буде виправлений у майбутньому. Це походить із походження обох фреймворків у метафорі "як би рандомізованої", на відміну від фізичної "слухаючої" метафори #Bookofwhy

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.