Я спробую дати вам інтуїтивне розуміння з мінімальним акцентом на математику.
Основна проблема спостережувальних даних та аналізів, які випливають із цього, - непорозуміння. Заплутаність виникає, коли змінна впливає не тільки на призначене лікування, але і на результати. Коли проводиться рандомізований експеримент, суб'єкти рандомізовані для лікування, так що в середньому суб'єкти, призначені кожному лікуванню, повинні бути подібними щодо коваріатів (вік, раса, стать тощо). В результаті такої рандомізації малоймовірно (особливо у великих зразках), що відмінності в результаті обумовлені будь-якими коваріатами, але завдяки застосованому лікуванню, оскільки, в середньому, коваріати в групах лікування схожі.
З іншого боку, за даними спостережень не існує випадкового механізму, який призначає суб'єктів для лікування. Візьмемо для прикладу дослідження для вивчення рівня виживання пацієнтів після нової операції на серці порівняно зі стандартною хірургічною процедурою. Зазвичай з етичних причин не можна рандомізувати пацієнтів до кожної процедури. В результаті пацієнти та лікарі самостійно вибирають один із видів лікування, часто через низку причин, пов’язаних із їх коваріатами. Наприклад, нова процедура може бути дещо ризикованішою, якщо ви старші, і в результаті лікарі можуть рекомендувати нове лікування частіше молодим пацієнтам. Якщо це трапиться, і ви дивитесь на рівень виживання, нове лікування може виявитися більш ефективним, але це буде вводити в оману, оскільки молодші пацієнти призначені для цього лікування, а молодші пацієнти, як правило, живуть довше, всі інші рівні. Ось тут корисні показники схильності.
Оцінка схильності допомагає вирішити основну проблему причинного висновку - те, що ви можете збитися з пантелику через невипадковість випадків лікування та це може бути причиною «наслідків», які ви бачите, а не втручання чи лікування. Якби вам вдалося якось змінити свій аналіз, щоб коваріати (скажімо, вік, стать, стать, стан здоров'я) були "збалансовані" між групами лікування, ви мали б вагомі докази того, що різниця в результатах зумовлена втручанням / лікуванням а не ці коваріати. Оцінки схильності визначають ймовірність кожного суб'єкта, який буде призначений для лікування, яке вони отримали, отримавши набір спостережуваних коваритів. Якщо ви збігаєтеся на ці ймовірності (показники схильності),
Ви можете запитати, чому ви точно не співпадаєте з коваріатами (наприклад, переконайтеся, що ви підходите до 40-річних чоловіків із хорошим здоров’ям у лікуванні 1 та 40-річних чоловіків із хорошим здоров’ям у лікуванні 2)? Це чудово працює для великих зразків і кількох коваріатів, але це стає майже неможливо зробити, коли розмір вибірки невеликий, а кількість коваріатів навіть помірно великого розміру (див. Прокляття розмірності на перехресній валідації, чому це так) .
Тепер, маючи на увазі все це, оцінка ахілесової п’ятки щодо схильності - це припущення про відсутність непомічених плутанини. Це припущення стверджує, що ви не змогли включити у ваше коригування жодні коваріати, які є потенційними плутанинами. Інтуїтивно зрозуміло, що причина цього полягає в тому, що якщо ви не включили конфордера під час створення вашої оцінки схильності, як ви можете налаштувати його? Існують також додаткові припущення, такі як припущення щодо стабільної одиничної величини лікування, яке говорить про те, що лікування, призначене одному суб'єкту, не впливає на потенційний результат інших суб'єктів.