Я намагаюся провести дискретний аналіз виживання часу за допомогою логістичної регресійної моделі, і я не впевнений, що повністю розумію цей процес. Я б дуже вдячний за допомогу з кількома основними питаннями.
Ось налаштування:
Я дивлюся на членство в групі протягом п'ятирічного періоду. Кожен член має щомісячний облік членства за кожен місяць, який є членом групи. Я розглядаю всіх членів, члени яких розпочалися протягом п'ятирічного періоду (щоб уникнути питань "лівої цензури" з членами, які приєдналися раніше). Кожен запис буде індексуватися часом, час один - місяць, до якого приєднався член. Отже, член, який залишається два з половиною роки, матиме тридцять щомісячних записів, пронумерованих від одного до тридцяти. Кожному запису також буде надана двійкова змінна, яка матиме значення одного за останній місяць членства, а нуль інакше; значення одиниці для двійкової змінної позначає подію, коли член вийшов із групи. Для кожного члена, членство якого продовжується за п'ятирічним вікном аналізу,
Отже, модель логістичної регресії побудована для прогнозування значень змінної бінарної події. Все йде нормально. Один з типових способів оцінювання бінарної моделі прогнозування - це вимірювання підйому на вибірці затримки. Для моделі логістичної регресії, яку я створив для прогнозу події, що закінчується членством, я обчислив підйом на наборі даних про тримання з співвідношенням п'яти до одного не подій до подій. Я класифікував прогнозовані значення в децили. Децил з найвищими прогнозованими значеннями містить сімдесят відсотків, ліфт більше чотирьох. Перші два децили в поєднанні містять шістдесят п’ять відсотків усіх тих, що знаходяться в обміні. У певних контекстах це вважатиметься досить гідною прогностичною моделлю, але мені цікаво, чи достатньо це для аналізу аналізу виживання.
Нехай - функція небезпеки для окремої в місяці , а - ймовірність того, що індивід виживе через місяць .
Ось мої основні питання:
Чи дискретна небезпечна функція, , умовна ймовірність невиживання (виходу з групи) кожного місяця?
Чи є прогнозовані значення з оцінки логістичної моделі регресії функції небезпеки? (тобто є дорівнює модельному прогнозованому значенню для індивідуального j у місяці k , чи потрібно зробити щось більше для отримання оцінок функції небезпеки?)
Чи дорівнює ймовірність виживання до місяця q для окремої дорівнює добутку на мінус функцію небезпеки від першого місяця до q , тобто чи S [ j , q ] = ( 1 - h [ j , 1 ] ) ⋅ ( 1 - h [ j , 2 ] ) ⋅ … ?
Чи є середнє значення всіх особин j за кожен час k розумною оцінкою загальної сукупності популяції?
Чи повинен графік загальної сукупності означати ймовірність виживання за місяцями, що нагадує щомісячний графік Каплана-Мейєра?
Якщо відповідь на будь-яке з цих питань - ні, то у мене серйозне непорозуміння, і я міг би реально скористатись допомогою / поясненням. Крім того, чи є якесь правило про те, наскільки хороша модель бінарного прогнозування повинна бути, щоб створити точний профіль виживання?