Чому в аналізі виживання ми використовуємо напівпараметричні моделі (пропорційні небезпеки Кокса) замість повністю параметричних моделей?


24

Я вивчав модель пропорційних небезпек Кокса, і це питання висвітлено в більшості текстів.

Кокс запропонував пристосувати коефіцієнти функції небезпеки, використовуючи метод часткової ймовірності, але чому б просто не підходити до коефіцієнтів параметричної функції виживання, використовуючи метод максимальної ймовірності та лінійну модель?

У будь-яких випадках, коли ви цензурували дані, ви могли просто знайти область під кривою. Наприклад, якщо ваша оцінка становить 380 зі стандартним відхиленням 80, а зразок цензурується> 300, то для цього зразка 84% ймовірність при розрахунку ймовірності передбачає нормальну помилку.


Наскільки мені подобається мати актуарні наукові питання, я мушу сказати, що це питання, ймовірно, допоможе отримати кращу відповідь на сайті статистики, Cross Validated. Ви можете попросити модератора перенести його.
Графік

Гаразд, не усвідомлював, що існує. Не знаєте, як подати запит на міграцію. Будь ласка, переселіться?

@Graphth, я також не усвідомлював, що є такий ... Я не знайшов його у списку "всіх сайтів", ти можеш тут посилатись на нього? Дякую

Відповіді:


27

Якщо ви знаєте параметричний розподіл, за яким слід ваші дані, використовуючи підхід з максимальною вірогідністю, і розподіл має сенс. Реальною перевагою регресії пропорційних небезпек Кокса є те, що ви все ще можете підходити до моделей виживання, не знаючи (або припускаючи) розподіл. Ви наводите приклад, використовуючи звичайний розподіл, але більшість часів виживання (та інших типів даних, для яких використовується регресія Кокса, PH) не наближаються до нормального розподілу. Деякі можуть дотримуватися нормального журналу, або Weibull, або іншого параметричного розподілу, і якщо ви готові зробити це припущення, то параметричний підхід максимальної ймовірності є великим. Але в багатьох випадках реального світу ми не знаємо, що таке відповідне розподіл (або навіть досить близьке наближення). За допомогою цензури та коваріатів ми не можемо зробити просту гістограму і сказати "що схоже на ... розподіл для мене". Тому дуже корисно мати техніку, яка добре працює, не потребуючи конкретного розподілу.

Навіщо використовувати небезпеку замість функції розподілу? Розглянемо наступне твердження: "Люди групи А вдвічі частіше помирають у віці 80 років, ніж люди групи В". Зараз це може бути правдою, тому що люди групи B, як правило, живуть довше, ніж люди групи А, або це може бути тому, що люди групи B, як правило, живуть коротше життя, і більшість з них померли задовго до 80 років, що дає дуже малу ймовірність з них помирає в 80 років, в той час як достатня кількість людей групи А доживає до 80 років, і досить велика їх кількість помре в цьому віці, що набагато більша ймовірність смерті в цьому віці. Тож те саме твердження може означати, що бути в групі А краще чи гірше, ніж бути у групі В. Що має більш сенс сказати, про тих людей (у кожній групі), які дожили до 80 років, яка частка загине до того, як їм виповниться 81 рік. Це небезпека (а небезпека - функція функції розподілу / функція виживання / тощо). З небезпекою легше працювати в напівпараметричній моделі, а потім може дати вам інформацію про розподіл.


7
Гарна відповідь. Унікальне з часом полягає в тому, що він проходить в одну сторону, і коли ми витримали період високого ризику, нас, головним чином, цікавлять ризики, які вже діють. Про це нам говорить функція небезпеки.
Френк Харрелл

2
Ще один момент, який варто додати, це те, що з цензурованими даними перевірити припущення щодо розподілу даних може бути дуже складно. Наприклад, припустимо, що лише 20% ваших суб'єктів спостерігають за подією. Намагатися визначити, чи відповідають хвости розподілу за розподілом Weibull, очевидно, не вдасться! Модель Cox-PH дещо сторонить проблему (але ви повинні бути дуже обережними щодо припущення про пропорційну небезпеку, якщо ви хочете екстраполювати до тих часів, які були високо цензуровані)
Cliff AB

16

"Ми" не обов'язково. Діапазон інструментів аналізу виживання варіюється від повністю непараметричних, як метод Каплана-Мейєра, до повністю параметричних моделей, де ви задаєте розподіл основної небезпеки. У кожного є свої переваги та недоліки.

Напівпараметричні методи, як модель пропорційної небезпеки Кокса, дозволяють вам уникнути невказання основної функції небезпеки. Це може бути корисно, оскільки ми не завжди знаємо основні функції небезпеки, а в багатьох випадках також не хвилюємося . Наприклад, багато досліджень епідеміології хочуть знати: "Чи зменшує експозиція X час до події Y?" Що їх хвилює - це різниця у пацієнтів, які мають Х та у яких немає Х. У цьому випадку основна небезпека насправді не має значення, а ризик неправильно визначити її гірший, ніж наслідки того, що цього не знати.

Однак бувають випадки, коли це теж не відповідає дійсності. Я зробив роботу з повністю параметрическими моделями , оскільки основна небезпека була інтерес.


1
"... і ризик неправильно визначити це гірше, ніж наслідки того, що цього не знати". Це було дуже корисно, дякую.

Чи можете ви навести приклад того, коли би представляла інтерес основна небезпека?
Dan Chaltiel

1
@DanChaltiel Прикладом може бути будь-яка оцінка, яка має на меті розглянути математичну модель або подібне - основна небезпечна функція викликає особливий інтерес.
Фоміт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.