Криві Каплана-Мейєра, схоже, говорять інакше, ніж регресія Кокса


9

У R я роблю аналіз даних про виживання хворих на рак.

Я читав дуже корисні матеріали про аналіз виживання в CrossValided та інших місцях і думаю, що зрозумів, як інтерпретувати результати регресії Кокса. Однак один результат все одно мене помиляє ...

Я порівнюю виживання проти статі. Криві Каплана-Мейєра явно корисні пацієнткам (я кілька разів перевіряв, чи додана легенда є вірною, пацієнтка з максимальною виживаністю, 4856 днів, справді жінка): введіть тут опис зображення

І регресія Кокса повертається:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

Отже коефіцієнт небезпеки (ЧСС) для пацієнтів чоловічої статі ( gendermale) становить 0,6903. Як я би трактував це (не дивлячись на криву Каплана-Мейєра), це: так як рівень ЧСС <1, бути пацієнтом чоловічої статі захисно. Або точніше, пацієнтка жінки на 1 / 0.6903 = exp (-coef) = 1.449 більше шансів померти в будь-який конкретний час, ніж чоловік.

Але це не схоже на те, що кажуть криві Каплана-Мейєра! Що не так з моєю інтерпретацією?


3
З вашої кривої КМ, схоже, PH припущення про регресію Кокса не дотримується.
Глибокий Північ

Розумію. Я раніше цього не розглядав! Графічно це означає, що мої криві Каплана-Мейєра повинні бути паралельними, щоб я міг безпечно використовувати Кокс, правда? Це здається більш-менш ОК до ~ 2200 днів. Чи добре переглянути результати Кокса для всіх даних трохи перед перехрестям?
francoiskroll

4
NB Це криві loglogS^i(t), де S^i(t) - оціночна функція виживання для групи i, це повинно бути паралельним при пропорційній небезпеці. Як зазначає @IWS, інтервали довіри будуть дуже широкими для жіночої групи приблизно через 3000 днів (чи є лише двоє, які пройдуть цю межу?), Тож припущення щодо PH може бути не надто поганим.
Scortchi

@DeepNorth: Я насправді не бачу вагомих доказів проти пропорційних небезпек. Так, криві технічно перекриваються ... але це на крайніх хвостах.
Кліф АВ

Щоб доповнити інші відповіді та коментарі, порівняйте середню виживаність або п’ятирічну виживаність для чоловіків та жінок. У цих даних є чітка користь для чоловіків у відповідності з аналізом Cox PH.
Ітамар

Відповіді:


12

Це дуже хороший приклад непропорційної небезпеки АБО ефекту «виснаження» в аналізі виживання. Спробую пояснити.

Спочатку добре погляньте на свою криву Каплан-Мейєр (КМ): ви можете побачити в першій частині (до приблизно 3000 днів) частка чоловіків, які ще живуть в популяції, що перебуває в групі ризику, в момент часу t більша, ніж частка жінок (тобто синя лінія "вище", ніж червона). Це означає, що чоловіча стать справді є «захисним» для дослідження події (смерті). Відповідно, коефіцієнт небезпеки повинен бути від 0 до 1 (а коефіцієнт повинен бути від'ємним).

Однак після дня 3000 червона лінія вища! Це дійсно наводить протилежне. Тільки грунтуючись на цьому графіку KM, це додатково передбачає непропорційну небезпеку. У цьому випадку "непропорційний" означає, що вплив вашої незалежної змінної (статі) з часом не є постійним. Іншими словами, коефіцієнт небезпеки може змінюватися в міру просування часу. Як було пояснено вище, це, мабуть, так і є. Звичайна пропорційна модель ризику Кокса не враховує таких наслідків. Власне, одне з головних припущень полягає в тому, що небезпеки пропорційні! Тепер ви також можете моделювати непропорційні небезпеки, але це виходить за рамки цієї відповіді.

Можна зробити ще один коментар: така різниця може бути пов’язана з тим, що справжня небезпека є непропорційною аботой факт, що в оцінці хвоста кривих КМ існує велика дисперсія. Зауважте, що на даний момент загальна група 348 пацієнтів скоротиться до дуже невеликої популяції, яка все ще знаходиться в групі ризику. Як бачимо, обидві гендерні групи мають пацієнтів, які переживають подію, та пацієнтів, які піддаються цензурі (вертикальні лінії). У міру зменшення чисельності населення ризики стануть менш певними. Якби ви намітили 95% довірчі інтервали навколо ліній КМ, ви б побачили, що ширина довірчого інтервалу збільшується. Це важливо і для оцінки небезпек. Простіше кажучи, оскільки кількість ризику та кількість подій в останньому періоді дослідження низька, цей період менше сприятиме оцінкам у вашій початковій моделі Кокса.

Нарешті, це пояснило б, чому небезпека (передбачається постійною протягом часу) більше відповідає першій частині вашого КМ, а не кінцевій кінцевій точці.

РЕДАКТУЙТЕ: див. Коментар у коментарях @ Scrotchi до первинного питання: Як зазначалося, ефект низьких чисел у останньому періоді дослідження полягає в тому, що оцінки небезпек у той момент часу є невизначеними. Отже, ви також менш впевнені, чи очевидне порушення пропорційного припущення про небезпеку не обумовлене випадковістю. Як стверджує @ scrotchi, припущення щодо PH не може бути таким поганим.


1
(-1) Хвости перетинаються на крайніх кінцях, де ми маємо надзвичайно мало даних. Насправді докази "непропорційної небезпеки" ґрунтуються лише на двох спостереженнях (тобто, коли t> 2800, у жіночій когорті залишилися лише два суб'єкти, і крім того, остання подія перед цією групою була навколо t = 2100)
Кліф АВ

2
@CliffAB Дякуємо за відгук Cliff AB. Я трохи розгублений, оскільки ваше зауваження саме те, що я намагався сказати. Я визнаю: це могло бути трохи коротше. -1 - хоч трохи суворий: '(
IWS

2
можливо, це було трохи погане для мене. Єдине, що я дивлюся на це, я не бачу обов'язково хорошого прикладу непропорційних небезпек, а досить малих даних про хвости. Я бачу, що перше речення було переглянуто (я думаю, якщо я цього разу не пропустив уперше?), Але тепер відповідь (-1) напевно не вимагається.
Кліф АВ

1
Ой, здається, я пропустив це вперше. Вибачте!
Кліф АВ

Немає проблем, принаймні, ми погоджуємося з відповіддю: D
IWS

5

Ви заплутані в характері результатів. Ці дані говорять: якщо ви чоловік, ви швидше живете довше жінки; Жінки мають ВЕРСІЮ виживаність, ніж чоловіки. Це відображається на регресійному виході, оскільки ефектом для MALE є негативний коефіцієнт небезпеки для журналу, наприклад, чоловіки мають менший ризик, ніж жінки. У більшості випадків (коли криві "крокують"), крива виживання самця більша, ніж у жінок, результати і графік Кокса дуже добре узгоджуються. Криві КМ підтверджують це, як і результат регресійної моделі. "Хрест" - це несуттєвий.

Криві КМ погано поводяться у хвостах, особливо коли вони близькі до 0% та / або звужуються рівно. Вісь Y - пропорція, що вижила. Якщо порівняно небагато тих, хто довго переживає дослідження, та мало хто помер у той час, то надійність оцінок є інтуїтивно зрозумілою та графічно жахливою. Я зауважу, наприклад, у вашій когорті помітно менше жінок, ніж чоловіків, і через 2800 днів у когорті залишається менше 10 жінок, про що свідчать кроки в кривій виживання та відсутність цензурних подій.

Як цікаву увагу, оскільки аналіз виживання за допомогою кривих КМ, тестів рангових журналів та моделей Кокса використовує ранжирований час виживання, фактична тривалість виживання дещо не має значення. Ваша найдовша жінка, що вижила, могла зазнати інфактності ще 100 років, і це не вплине на аналізи. Це тому, що основна функція небезпеки (не спостерігаючи жодних подій протягом останніх 13 років) передбачає, що не було ризику смерті протягом наступних 87 років, оскільки ніхто тоді не помер.

Якщо ви хочете, щоб надійний HR отримував правильні 95% CI та p-значення для цього, вкажіть robust=TRUEу Cox-PH для отримання стандартних помилок сендвіч. У такому випадку ЧСС - це середньостатистична ЧСС, яка порівнює чоловіків та жінок у всі періоди відмови.


Для уточнення: На ділянці КМ чоловіки мають кращу виживаність приблизно до 2700 днів. Після цього жінки мають краще виживання. Але цей хвіст не точний, тому що там так мало даних. Ви можете бачити, що два кроки в кривій КМ вимагають виживання жінок приблизно від 35% до 0%, так що, швидше за все, це двоє людей. Було б корисно побудувати криві КМ з діапазонами довіри. Тоді я б здогадався, що ви побачите чітке розмежування приблизно до 2000 днів, а потім перекриєтесь після цього.
Харві Мотульський

2
@HarveyMotulsky правда, але хвости КМ дуже ненадійні. Якби ОП притягувала КІ, вони сильно перекривались, так що начебто ми могли б сказати, що виживання було, ймовірно, однозначним через 2700 днів.
AdamO

Точно моя думка. Дані наочно показують, що чоловіки (у цій ситуації, як би там не було) мають кращу виживаність принаймні перші 2000+ днів.
Харві Мотульський
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.