Як інтерпретувати криву виживання моделі Кокса?


9

Як ви інтерпретуєте криву виживання з пропорційною моделлю небезпеки Кокса?

У цьому прикладі іграшки, припустимо, ми маємо коксову пропорційну модель небезпеки для ageзмінної kidneyданих та генеруємо криву виживання.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

введіть тут опис зображення

Наприклад, на час 200, яке твердження вірно? або обидва помиляються?

  • Заява 1: у нас залишиться 20% суб'єктів (наприклад, якщо є 1000 люди, по днях 200, ми повинні мати приблизно 200 зліва),

  • Заява 2: Для однієї особи він має 20% шанс вижити за день 200.


Моя спроба: я не вважаю, що ці два твердження однакові (виправте мене, якщо я помиляюся), оскільки у нас немає припущення про iid (час виживання для всіх людей НЕ черпає з одного розподілу незалежно). Він схожий на логістичну регресію в моєму питанні тут , швидкість небезпеки кожної людини залежить від того,βTx для цієї людини.


Зауважте, що ваша модель передбачає незалежність між часом події.
окрам

Аналіз виживання може мати припущення про незалежність
Аксакал

тому здається, що питання справді стосується кодування R, а не чистої статистики. потрібно знати синтаксис та особливості конкретних функцій, використаних у прикладі. якщо це так, чи не є це поза темою в чомусь? інакше вам потрібно пояснити, що відбувається з тими, хто не використовує R
Aksakal

Відповіді:


5

Оскільки небезпека залежить від коваріатів, так і функція виживання. Модель передбачає, що небезпечна функція людини з коваріатним векторомx є

h(t;x)=h0(t)eβx.
Отже, накопичувальна небезпека цієї особи є
H(t;x)=0th(u;x)du=0th0(u)eβxdu=H0(t)eβx,
де ми можемо визначитись H0(t)=0th0(u)duяк базовий рівень накопичувальної небезпеки. Функція виживання для індивіда з коваріатним векторомx у свою чергу
S(t;x)=eH(t;x)=eH0eβx=S0(t)eβx
де ми визначаємо S0(t)=eH0(t) як основна функція виживання.

Дано оцінки β^ і S^0(t) коефіцієнтів регресії та основної функції виживання, оцінка функції виживання для людини з коваріатним вектором x дається S^(t;x)=S^0(t)eβ^x.

Обчисливши це в R, ви вкажете значення своїх коваріатів у newdataаргументі. Наприклад, якщо ви хочете, щоб функція виживання для людей віком = 70, в R, зробіть

plot(survfit(fit, newdata=data.frame(age=70)))

Якщо ви, як і ви, опускаєте newdataаргумент, його значення за замовчуванням дорівнює середнім значенням коваріатів у вибірці (див. ?survfit.coxph). Тож, що зображено на графіку, це оцінкаS0(t)eβx¯.


Я погоджуюсь з тобою. Це гарно написана відповідь. Прошу вибачення в ОП за свою помилку і я ціную те, як ОП виправила її.
Майкл Р. Черник

@ hxd1101 Прочитавши survfit.coxphретельніше сторінку довідки , я виправив помилку у своїй відповіді, див. оновлення.
Jarle Tufto

2

У нас залишиться 20% випробовуваних (наприклад, якщо у нас 1000 людей, до дня 200, у нас повинно залишитися 200)? або Для даної людини це 20% шансів вижити в день 200?

У самому чистому вигляді крива Каплана-Мейєра у вашому прикладі не робить жодного з перерахованих вище тверджень.

Перше твердження передбачає, що прогноз у майбутньому буде мати . Основна крива виживання описує лише минуле, ваш зразок. Так, 20% вашого зразка вижили до 200 дня. Чи виживе 20% у наступні 200 днів? Не обов'язково.

Для того, щоб зробити це твердження, ви повинні додати більше припущень, побудувати модель і т.д. Модель навіть не повинна бути статистичною в сенсі, як логістична регресія. Наприклад, це може бути PDE в епідеміології тощо.

Ваше друге твердження, ймовірно, засноване на якомусь припущенні про однорідність: всі люди однакові.


Я не думаю, що твердження 2 є правильним, оскільки у кожної людини різні x і βTxсприяє небезпеці. як можна вважати, що всі люди однакові?
Haitao Du

@ hxd1011, це залежить від вашої моделі. Якщо б ви моделювали деталі автомобілів, то ви могли б дуже припустити, що вони однакові. з іншого боку, їх невдачі можуть бути співвіднесені з номером партії, тоді вони не однакові і т. д.
Аксакал

Я відредагував своє запитання, щоб бути більш конкретним щодо моделі Кокса, чи все ще застосовується ваша відповідь на кривій Kaplan_Meier?
Хайтао Дю,

2

Дякую за відповідь Джарле Туфто. Я думаю, що я мав би змогу відповісти на це сам: обидва твердження помилкові . Генерована крива єS0(t) але не S(t).

Основна функція виживання S0(t) буде дорівнює S(t) тільки коли x=0. Тому крива НЕ описує всю сукупність чи будь-яку людину.


0

Ваш перший варіант правильний. Взагалі,S(t)=0.2 вказує на те, що 20% початкових пацієнтів дожили до дня t, без урахування цензури . За цензурованими даними не зовсім коректно сказати, що 20% були ще живими в той день , оскільки деякі з них були втрачені для подальшого спостереження, і їх статус невідомий. Кращий спосіб сказати, що за оцінками, частка пацієнтів, які ще живі в цей день, становить 20% .

Другий варіант (шанс пережити ще один день, враховуючи виживання до t) є 1h(t), с h(t) що позначає функцію небезпеки.

Щодо припущень: я думав, що звичайні тести на коефіцієнт у регресійному режимі Кокса передбачають незалежність, що залежить від спостережуваних коваріатів? Навіть оцінка Каплана-Мейєра вимагає незалежності між часом виживання та цензурою ( посилання ). Але я можу помилятися, тому коригування вітаються.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.