Скажімо, нам задається наступна проблема:
Прогнозуйте, які клієнти, швидше за все, припинять купувати в нашому магазині протягом наступних 3 місяців.
Для кожного клієнта ми знаємо місяць, коли його почали купувати в нашому магазині, а також ми маємо багато поведінкових особливостей у щомісячних агрегатах. "Старший" клієнт купує вже п'ятдесят місяців; позначимо час, коли клієнт почав купувати через ( ). Можна припустити, що кількість клієнтів дуже велика. Якщо клієнт припиняє купувати на три місяці, а потім повертається, то він розглядається як новий клієнт, тому подія (припинення покупки) може статися лише один раз.
На думку мені приходять два рішення:
Логістичний регрес - для кожного клієнта та кожного місяця (можливо, за винятком трьох останніх місяців) ми можемо сказати, чи припинив клієнт купувати чи ні, тому ми можемо робити прокатні зразки з одним спостереженням на клієнта та місяць. Ми можемо використовувати кількість місяців від початку як категоричну змінну, щоб отримати деякий еквівалент функції базової небезпеки.
Розширена модель Кокса - Ця проблема також може бути змодельована за допомогою розширеної моделі Кокса. Здається, ця проблема більше підходить для аналізу виживання.
Питання: Які переваги аналізу виживання у подібних проблемах? Аналіз виживання був придуманий чомусь, тому має бути якась серйозна перевага.
Мої знання в аналізі виживання не дуже глибокі, і я думаю, що більшість потенційних переваг моделі Кокса також можна досягти за допомогою логістичної регресії.
- Еквівалент стратифікованої моделі Кокса можна отримати, використовуючи взаємодію і стратифікуючої змінної.
- Модель взаємодії Кокса може бути отримана шляхом занурення населення в декілька підгруп та оцінки LR для кожної підгрупи.
Єдина перевага, яку я бачу, - це те, що модель Кокса є більш гнучкою; наприклад, ми можемо легко обчислити ймовірність того, що клієнт перестане купувати через 6 місяців.