Припустимо, я побудував модель прогнозування виникнення певної хвороби в одному наборі даних (набір даних щодо побудови моделі) і тепер хочу перевірити, наскільки добре працює модель у новому наборі даних (валідація даних). Для моделі, побудованої з логістичною регресією, я обчислював би прогнозовану ймовірність для кожної людини в наборі даних перевірки на основі модельних коефіцієнтів, отриманих із набору даних про побудову моделі, а потім, після дихотомізації цих ймовірностей за деяким значенням відсікання, я можу побудувати таблицю 2x2 що дозволяє мені обчислити справжню позитивну швидкість (чутливість) та справжню негативну швидкість (специфічність). Більше того, я можу побудувати всю криву ROC, змінюючи обріз, а потім отримати AUC для графіка ROC.
Тепер припустимо, що я фактично маю дані про виживання. Отже, я використав модель пропорційної небезпеки Кокса в наборі даних про створення моделі і тепер хочу перевірити, наскільки добре працює модель у наборі даних перевірки. Оскільки базовий ризик не є параметричною функцією в моделях Кокса, я не бачу, як я можу отримати прогнозовану ймовірність виживання для кожної людини в наборі даних перевірки на основі модельних коефіцієнтів, отриманих у наборі даних про побудову моделі. Отже, як я можу перевірити, наскільки добре працює модель у наборі даних перевірки? Чи існують усталені методи для цього? І якщо так, чи реалізовані вони в будь-якому програмному забезпеченні? Заздалегідь дякую за будь-які пропозиції!