Я працюю над розробкою моделі прогнозування страхового ризику. Ці моделі є "рідкісними подіями", такими як прогнозування несанкціонованого обслуговування авіакомпанії, виявлення несправностей в апараті тощо. Під час підготовки набору даних я намагався застосувати класифікацію, але не зміг отримати корисні класифікатори через велику частку негативних випадків .
Я не маю багато досвіду в статистиці та моделюванні даних поза курсом статистики середньої школи, тому я ніби не розгублений.
Як спочатку думав, я думав використовувати неоднорідну модель процесу Пуассона. Я класифікував це на основі даних про події (дата, лат., Тривалість життя), щоб отримати хорошу оцінку шансів ризику в конкретний час у конкретний день у конкретному місці.
Мені хотілося б знати, які методики / алгоритми прогнозують рідкісні події?
Що ви рекомендуєте як підхід до вирішення цієї проблеми?