Проста відповідь - зважування. Тобто, ви можете використовувати ваги для стандартизації груп у "прийнятій" групі для населення, яке цікавить. Проблема, яка виникає при використанні таких ваг в об'єднаному аналізі, використовуючи як фази першого, так і другого двох років, полягає в тому, що розрахункові ваги сукупності та параметри тепер залежать. Зазвичай використовується псевдоподібний підхід (у цьому випадку це буде якась псевдо-часткова ймовірність), коли ви ігноруєте залежність між вагою вибірки та оцінкою параметрів. Однак у багатьох практичних обставинах (і цей не відрізняється) облік цієї залежності необхідний. Питання створення ефективного оцінювача коефіцієнтів небезпеки є складним, і наскільки я знаю, відкритим було закінчено.
Покращена оцінка Горвіца-Томпсона модельних параметрів з двофазних стратифікованих зразків: застосування в епідеміології .
У статті розглядаються методи опитування, які зазвичай застосовуються при логістичній регресії, однак ви також можете зважити дані про виживання. Деякі важливі міркування, які ви нехтували зазначенням, - це зацікавлення у створенні прогнозу, який стосується всього населення, або до "кваліфікованого" населення на основі дворічних оцінок, або "кваліфікуючого" населення на основі отриманих результатів модель. Ви також не згадали, як саме така модель "прогнозування" створюється з моделі Кокса, оскільки придатні значення з моделі Кокса не можуть трактуватися як ризики. Я припускаю, що ви оцінюєте коефіцієнти небезпеки, а потім отримуєте зглажену оцінку базової функції небезпеки.