Чому показник схильності відповідає результату причинного висновку?


13

Відповідність показника схильності використовується для причинно-наслідкових висновків у спостережних дослідженнях (див. Статтю Розенбаум / Рубін ). Яка проста інтуїція, за якою вона працює?

Іншими словами, чому, якщо ми впевнені, що ймовірність участі в лікуванні є рівною для двох груп, сумнівні наслідки зникають, і ми можемо використати результат, щоб зробити причинно-наслідкові висновки щодо лікування?


8
Моя, мабуть, непопулярна думка, але я думаю, що твердження, що PSM дозволяє робити причинно-наслідкові умовиводи, це трохи розтягує її. Так, це більш тонкий метод узгодження, ніж просто "грубе" зіставлення на кількох змінних, але наприкінці дня ви все ще підходите лише до тих змінних, які спостерігаються для вас. Можливо, ви все ще будете проводити ендогенне лікування, але ви припускаєте, що після відповідного лікування лікування є екзогенним. Але знову ж таки, я ніхто в порівнянні з подобається Рубіну :)
Маркіз де Карабас

5
Є ті, хто не згоден з Розенбаумом та Рубіном. Гері Кінг доволі ефективно стверджував, що результати зіставлення за допомогою PSM поступаються результатам, отриманим від збігу на основі відстані Mahalanobis. Див своєї статті тут ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 Крім того, цей веб - семінар забезпечує ще більш переконливі докази ... methods-colloquium.com / ...
Mike Hunter

4
Теоретично ви МОЖЕТЕ зробити причинний висновок, застосовуючи причинну модель Рубіна, якщо всі припущення виконані. Але, звичайно, диявол завжди в деталях припущення, і для мене припущення про непомічених плутанини часто буває важким. Насправді це неможливо довести. Але ви можете принаймні провести аналіз чутливості, щоб визначити, що знадобиться для зміни ваших висновків, якби у вас були непомічені плутанини.
СтатистикаСвіт

5
Хороший момент @DJohnson. Є також подібні Джудея Перл, Ян Шрієр і Арвід Шоландер, які критично ставляться до рамки потенційних результатів Рубіна для каузального висновку через можливість введення "M-упередженості" через те, що вони називають "коллайдером". Вони цікаві читання і повинні доповнювати будь-які читання Рубіна.
СтатистикаСвіт

Відповіді:


12

Я спробую дати вам інтуїтивне розуміння з мінімальним акцентом на математику.

Основна проблема спостережувальних даних та аналізів, які випливають із цього, - непорозуміння. Заплутаність виникає, коли змінна впливає не тільки на призначене лікування, але і на результати. Коли проводиться рандомізований експеримент, суб'єкти рандомізовані для лікування, так що в середньому суб'єкти, призначені кожному лікуванню, повинні бути подібними щодо коваріатів (вік, раса, стать тощо). В результаті такої рандомізації малоймовірно (особливо у великих зразках), що відмінності в результаті обумовлені будь-якими коваріатами, але завдяки застосованому лікуванню, оскільки, в середньому, коваріати в групах лікування схожі.

З іншого боку, за даними спостережень не існує випадкового механізму, який призначає суб'єктів для лікування. Візьмемо для прикладу дослідження для вивчення рівня виживання пацієнтів після нової операції на серці порівняно зі стандартною хірургічною процедурою. Зазвичай з етичних причин не можна рандомізувати пацієнтів до кожної процедури. В результаті пацієнти та лікарі самостійно вибирають один із видів лікування, часто через низку причин, пов’язаних із їх коваріатами. Наприклад, нова процедура може бути дещо ризикованішою, якщо ви старші, і в результаті лікарі можуть рекомендувати нове лікування частіше молодим пацієнтам. Якщо це трапиться, і ви дивитесь на рівень виживання, нове лікування може виявитися більш ефективним, але це буде вводити в оману, оскільки молодші пацієнти призначені для цього лікування, а молодші пацієнти, як правило, живуть довше, всі інші рівні. Ось тут корисні показники схильності.

Оцінка схильності допомагає вирішити основну проблему причинного висновку - те, що ви можете збитися з пантелику через невипадковість випадків лікування та це може бути причиною «наслідків», які ви бачите, а не втручання чи лікування. Якби вам вдалося якось змінити свій аналіз, щоб коваріати (скажімо, вік, стать, стать, стан здоров'я) були "збалансовані" між групами лікування, ви мали б вагомі докази того, що різниця в результатах зумовлена ​​втручанням / лікуванням а не ці коваріати. Оцінки схильності визначають ймовірність кожного суб'єкта, який буде призначений для лікування, яке вони отримали, отримавши набір спостережуваних коваритів. Якщо ви збігаєтеся на ці ймовірності (показники схильності),

Ви можете запитати, чому ви точно не співпадаєте з коваріатами (наприклад, переконайтеся, що ви підходите до 40-річних чоловіків із хорошим здоров’ям у лікуванні 1 та 40-річних чоловіків із хорошим здоров’ям у лікуванні 2)? Це чудово працює для великих зразків і кількох коваріатів, але це стає майже неможливо зробити, коли розмір вибірки невеликий, а кількість коваріатів навіть помірно великого розміру (див. Прокляття розмірності на перехресній валідації, чому це так) .

Тепер, маючи на увазі все це, оцінка ахілесової п’ятки щодо схильності - це припущення про відсутність непомічених плутанини. Це припущення стверджує, що ви не змогли включити у ваше коригування жодні коваріати, які є потенційними плутанинами. Інтуїтивно зрозуміло, що причина цього полягає в тому, що якщо ви не включили конфордера під час створення вашої оцінки схильності, як ви можете налаштувати його? Існують також додаткові припущення, такі як припущення щодо стабільної одиничної величини лікування, яке говорить про те, що лікування, призначене одному суб'єкту, не впливає на потенційний результат інших суб'єктів.


7

У строгому сенсі коригування оцінки схильності не має більше нічого спільного з причинним висновком, ніж регресійне моделювання. Єдина реальна відмінність від показників схильності полягає в тому, що вони полегшують коригування для більш спостережуваних потенційних конфузентів, ніж цей розмір вибірки може дозволяти регресійним моделям включатись. Коригування шкали схильності (найкраще проводити через кореваційне коригування у більшості випадків, використовуючи сплайнер у програмі PS Logit), можна розглядати як техніку зменшення даних, де зменшення ведеться за важливою віссю - заплутаною. Однак він не справляється з неоднорідністю результатів (зміщення сприйнятливості), тому вам також доведеться налаштовуватися на ключові важливі коваріати навіть при використанні схильностей (див. Також питання, пов'язані з нерозбірливістю коефіцієнтів шансів і небезпек).

Відповідність балів схильності може виключати безліч спостережень і, таким чином, бути надзвичайно неефективною. Я вважаю будь-який метод, який виключає відповідні спостереження, як проблематичний. Справжня проблема співставлення полягає в тому, що вона виключає спостереження, що легко узгоджуються, через певну необхідність у встановленні відповідності 1: 1, а більшість алгоритмів відповідності залежать від порядку спостереження.

Зауважте, що це дуже просто, коли ви робите стандартну корекцію регресії для плутанини для перевірки та виключення регіонів, що не перетинаються. Користувачів, які оцінюють схильність, привчають до цього, і єдиною причиною того, що моделюють регресію, є те, що вони цього не вчать.

Аналіз оцінки схильності приховує будь-які взаємодії з впливом, а відповідність балів схильності приховує, крім того, можливу залежність між ПС та ефектом лікування.

Аналіз чутливості (до незмірних плутанини) був розроблений для PS, але це ще простіше зробити зі стандартним регресійним моделюванням.

Якщо ви використовуєте гнучкі методи регресії для оцінки PS (наприклад, не припускайте, що будь-які безперервні змінні діють лінійно), вам навіть не потрібно перевіряти баланс - повинен бути баланс або модель регресії PS не була вказана правильно на початку . Потрібно лише перевірити наявність неперекриття. Це передбачає, що немає важливих взаємодій, які були б опущені з моделі схильності. Узгодження робить те саме припущення.


3

Я рекомендую перевірити здебільшого нешкідливу економетрію - вони мають чітке пояснення цього на інтуїтивно зрозумілому рівні.

Проблема, яку ви намагаєтеся вирішити, - це зміщення вибору. Якщо змінна співвідноситься з потенційними результатами та ймовірністю прийому лікування, то, якщо ви виявите, що очікуваний результат від лікування буде кращим, ніж очікуваний результат нелікованого, це може бути хибною знахідкою, оскільки оброблені, як правило, мають вищий і тому мають вищий . Проблема виникає через те, що робить співвіднесеними з лікуванням.xiy0i,y1ixy0i,y1ixy0i,y1i

Цю проблему можна вирішити, керуючи . Якщо ми думаємо, що зв'язок між потенційними результатами та змінними є лінійним, ми просто робимо це, включаючи в регресію з фіксованою змінною для лікування, і фіктивну змінну взаємодіє з . Звичайно, лінійна регресія гнучка, оскільки ми можемо включати і функції . Але що робити, якщо ми не хочемо нав'язувати функціональну форму? Тоді нам потрібно використовувати непараметричний підхід: узгодження.xxxxx

Зіставляючи, ми порівнюємо оброблені та необроблені спостереження з аналогічними . Ми відходимо від цього з оцінкою ефекту від лікування всіх значень (або малих діапазонів значень або "відра"), за якими ми маємо як оброблені, так і неліковані спостереження. Якщо у нас не так багато таких значень або відер, зокрема, якщо є великомірним вектором, тому важко знайти спостереження, близькі одне до одного, тоді корисно спроектувати цей простір на один вимір.xxxx

Це те, що робить показник схильності. Якщо не співвідносяться з лікуванням, що дається , то виявляється, що вони також не співвідносяться з лікуванням, заданим де - ймовірність лікування, що дається , тобто показник схильності з .y0i,y1ixip(xi)p(x)xx

Ось ваша інтуїція: якщо ми знайдемо підбірку спостережень з дуже подібною оцінкою схильності , то для цього підпроби оброблені та необроблені групи не співвідносяться з . Кожне спостереження з однаковою ймовірністю піддається лікуванню або не лікуванню; це означає, що будь-яке оброблене спостереження з однаковою ймовірністю походить від будь-якого із значень в підпробовці. Оскільки є тим, що визначає потенційні результати в нашій моделі, це означає, що для цієї під вибірки потенційні результатиp(x)xxxy0i,y1iє некорельованими з лікуванням. Ця умова гарантує, що середня різниця результатів підробленої та нелікованої субпроби є послідовною оцінкою середнього ефекту лікування для цього підпроби, тобто

E[yi|Treated,p(x)]E[yi|Untreated,p(x)]

є послідовною оцінкою місцевого середнього ефекту лікування.

Подальше читання:

Чи дійсно ми повинні використовувати на практиці відповідність показника схильності?

Пов'язане питання, порівнюючи відповідність та регресію


1

Це "працює" з тієї ж причини, що і "регресія" працює - ви керуєте всіма заплутаними факторами.

Такий аналітичний контроль можна здійснити за допомогою повністю заданої регресійної моделі з, можливо, безліччю заплутаних змінних, або регресійної моделі, що має лише одну змінну - показник схильності (що може бути або не бути однаково складною моделлю, що складається з тих самих конфузорів). Ви можете дотримуватися цієї регресії та оцінки схильності або порівняти відповідь у подібних групах, де схожість визначається балом схильності. З духом ви робите те саме, але деякі люди вважають, що останній метод краще підкреслює причинну задачу.

Оновіть за відгуками

Моя думка пояснити інтуїцію, за якою працює показник відповідності показникам схильності, - пояснити теорему шкали схильності , тобто що я думав, що можу зробити за допомогою регресії. Але як стверджує @StatsStudent, регресія дозволяє легко екстраполювати порівняння між лікуванням та контролем, які ніколи не трапляються в даних. Якщо це частина того, чому показник схильності відповідає "працює", то моя відповідь була неповною. Я консультувався з контрфактиками та причинним висновком

Y(0),Y(1)T|XY(0),Y(1)T|p(X),
і читайте про одну з версій узгодження найближчого сусіда, що називається "співставлення суппорта" (стор. 108), де показники схильності лікування та найближчий контрольний випадок повинні знаходитись на деякій максимальній відстані, внаслідок чого деякі випадки лікування не відповідають. У цьому випадку метод все-таки буде працювати, коригуючи показник схильності, використовуючи непараметричний аналог до регресії, але він також дає зрозуміти, що не може бути відоме лише з даних (без моделі екстраполяції з) та дозволяє переосмислити причинно-наслідкова кількість з урахуванням наявних даних.

1
Цю відповідь судилося не любити, оскільки вона здешевлює методи оцінки схильності, порівнюючи їх з регресією, брудним словом у причинних колах. Але провідна відповідь визнає, що «оцінка ахілесової п’ятки щодо схильності - це припущення про відсутність непомічених плутанини». Це досить великий ахілесовий каблук. Скажіть, припущення виконане, і я отримав набір даних із усіма звірниками у Всесвіті. Допоможіть мені зрозуміти, чому регресія не допоможе розкрити причинно-наслідкову істину, але відповідність буде оцінці схильності.
Бен Огорек

1
Причина, чому регресія часто є проблематичною, полягає в тому, що результати регресії екстраполюються. Оцінюючи схильність, під час перевірки коваріаційного балансу слід забезпечити достатнє перекриття між групами лікування. Це не обов'язково має місце в регресії, і це може призвести до неточних оцінок, оскільки немає стандартних діагностичних перевірок, які дозволять сказати, що ваша регресійна модель екстраполюється. Ось чому я, як правило, запускаю перевірку балансування показників схильності, навіть якщо я просто запускаю регресійну модель і не планую сам використовувати показники схильності.
СтатистикаStudent
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.