Я знаю, що традиційні статистичні моделі, такі як регресія пропорційних ризиків Кокса та деякі моделі Каплана-Мейєра, можуть використовуватися для прогнозування днів до наступного виникнення події, наприклад, відмови тощо, тобто аналізу виживання
Запитання
- Як можна використовувати регресійну версію моделей машинного навчання, таких як GBM, нейронні мережі тощо, для прогнозування днів до настання події?
- Я вважаю, що використання днів до виникнення як цільової змінної та простого запуску регресійної моделі не вийде? Чому це не працює і як це можна виправити?
- Чи можемо ми перетворити задачу аналізу виживання в класифікацію і потім отримати ймовірності виживання? Якщо тоді як створити змінну бінарної цілі?
- Які плюси та мінуси підходу до машинного навчання проти регресії пропорційних небезпек Кокса та моделей Каплана-Меєра тощо?
Уявіть, що вибіркові вхідні дані мають наступний формат
Примітка:
- Датчик записує дані з інтервалом в 10 хвилин, але часом дані можуть бути відсутніми через випуск мережі тощо, як це представлено рядком з NA.
- var1, var2, var3 - це предиктори, пояснювальні змінні.
- fail_flag повідомляє, вийшла з ладу машина чи ні.
- Ми маємо дані за останні 6 місяців через кожні 10 хв інтервалу для кожної машини
Редагувати:
Очікуване прогнозування виходу має бути у форматі нижче
Примітка. Я хочу передбачити ймовірність виходу з ладу для кожної з машин протягом наступних 30 днів на щоденному рівні.
failure_flag
.