Як оцінити корисність придатних для виживаних функцій


9

Я новачок у аналізі виживання, хоча маю певні знання щодо класифікації та регресії.

Для регресії ми маємо статистику MSE та R квадрат. Але як можна сказати, що модель виживання A перевершує модель виживання B, крім деяких графічних графіків (крива КМ)?

Якщо можливо, поясніть різницю прикладом (наприклад, пакет rpart в R). Як ви можете показати, що одне дерево виживання CART краще, ніж інше дерево виживання CART? Які показники можна використовувати?


3
Існує безліч видів аналізу виживання. Деякі з них справді засновані на регресії. Деякі з них, як КМ, можна легше розглядати як оцінювачі статистики, пов'язаної з виживаністю.
Олексій

Дякуємо вам за ваші подальші зусилля щодо вдосконалення вашого питання. Я підозрюю, що зараз відповідає / підходить для резюме. Я висунув це на повторне відкриття. Ми побачимо, чи згодні інші. Це може допомогти, якщо ви можете опублікувати дві моделі виживання типу CART, які люди можуть використовувати для пояснення цих проблем.
gung - Відновіть Моніку

1
Бен, в основному ти кажеш, що в пропорційній регресії небезпеки Кокса немає (поки що) жодного хорошого способу оцінити корисність? R-Square не призводить до хороших результатів, оскільки він не може правильно поводитись з цензурованими спостереженнями та нецензурованими спостереженнями? Ви говорите про Harrells c, чи правильно я зрозумів, що метод не застосовується до регресії Cox-PH?
Коста С.

Відповіді:


9

Основна проблема зі статистикою на зразок моделі Кокса R2(описано в іншій відповіді) полягає в тому, що це дуже залежить від цензурного розподілу ваших даних. У інших природних речах, на які ви можете звернути увагу, наприклад, відношення ймовірності до нульової моделі, також є ця проблема. (Це в основному тому, що внесок цензурованої точки даних у ймовірність сильно відрізняється від внеску точки даних, де спостерігається подія, тому що одна з них походить з PDF, а одна з них - від CDF.) Різні дослідники запропоновані способи подолати це, але ті, які я бачив, зазвичай вимагають, щоб ви мали модель розподілу цензури або щось не менш практичне. Я не розглядав, наскільки ця залежність є поганою на практиці, тому, якщо ваша цензура є досить м'якою, ви все ще можете вивчити статистику на основі ймовірності. Для моделей CART для виживання,

Для загальних моделей виживання, один часто використовуваний статистика Харрелл в с індексом, аналог Кендаллаτабо ROC AUC для моделей виживання. По суті, c - це пропорція з усіх випадків, коли вам відомо, що один екземпляр пережив подію пізніше, ніж інший, що модель належить до правильного ранжирування. (Іншими словами, для включення пари екземплярів до знаменника тут, максимум, один може бути цензурований, і він повинен бути цензурований після того, як інший пережив подію.) Індекс c також залежить від розподілу цензури, але на думку Гаррелла, залежність м'якша, ніж для інших статистичних даних, про які я згадував вище. На жаль, c. Гарреллатакож менш чутливий, ніж наведені вище статистичні дані, тому ви, можливо, не захочете обирати між собою моделі, якщо різниця між ними невелика; це більше корисно як інтерпретаційний показник загальної продуктивності, ніж спосіб порівняння різних моделей.

(Нарешті, звичайно, якщо ви маєте на увазі конкретні цілі для моделей - тобто, якщо ви знаєте, яка ваша функція втрати передбачення - ви завжди можете оцінити їх відповідно до функції втрати! Але я здогадуюсь, що ви ' Вам не так пощастило ...)

Для обговорення більш поглибленого як статистики відношення правдоподібності і Харрелл в с , ви повинні дивитися на прекрасний підручник Харрелл в регресійного моделювання стратегій . Розділ про оцінку моделей виживання - §19.10, стор 492-493. Вибачте, що не можу дати вам однозначної відповіді, але я не думаю, що це вирішена проблема!


5

Коксові пропорційні регресії небезпеки для даних виживання можна вважати відповідними стандартним регресіям у багатьох аспектах. Наприклад, регресії Кокса також забезпечують залишкові стандартні помилки та статистику R-квадрата. Дивіться coxphфункцію в survivalпакеті R. (Ви можете вважати криві КМ як відповідні непараметричним аналізам у стандартній статистиці. Як би ви включили непараметричний тест у КАРТ?) На практиці з клінічними даними залишкові стандартні помилки мають тенденцію бути високими, а значення R-квадрата - низькими. в регресії Кокса.

Таким чином, стандартні регресії та регресії Кокса мають подібні вимоги та обмеження. Ви повинні переконатися, що ці дані відповідають основним припущенням, що в аналізі Кокса додатково включає припущення, що небезпеки, що порівнюються, пропорційні в часі. Вам все одно доведеться уникати переобладнання, і вам доведеться підтвердити свою модель. І як я розумію CART, хоча я сам не використовую її, ви все ще зіткнетесь із труднощами, породженими порівнянням невкладених моделей.


Дякуємо за Вашу відповідь про різницю та стосунки між регресією Кокса та регресією. Але я хочу знати, як порівнювати дві моделі виживання дерев рішень (CART).
затоплення

Папір із відкритим доступом, пов'язаний на сайті projecteuclid.org/euclid.ssu/1315833185, є досить недавним оглядом та порівнянням методів побудови та вибору дерев виживання на основі rpartта інших пакетів та коду R.
EdM

Дякуємо, що виклали папір. Я зараз прочитаю папір.
затоплення
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.