Як ми прогнозуємо рідкісні події?


11

Я працюю над розробкою моделі прогнозування страхового ризику. Ці моделі є "рідкісними подіями", такими як прогнозування несанкціонованого обслуговування авіакомпанії, виявлення несправностей в апараті тощо. Під час підготовки набору даних я намагався застосувати класифікацію, але не зміг отримати корисні класифікатори через велику частку негативних випадків .

Я не маю багато досвіду в статистиці та моделюванні даних поза курсом статистики середньої школи, тому я ніби не розгублений.

Як спочатку думав, я думав використовувати неоднорідну модель процесу Пуассона. Я класифікував це на основі даних про події (дата, лат., Тривалість життя), щоб отримати хорошу оцінку шансів ризику в конкретний час у конкретний день у конкретному місці.

Мені хотілося б знати, які методики / алгоритми прогнозують рідкісні події?
Що ви рекомендуєте як підхід до вирішення цієї проблеми?

Відповіді:


9

Стандартний підхід - " теорія екстремальної вартості ", є чудова книга на цю тему Стюарта Коула (хоча нинішня ціна здається скоріше помилковою ... екстремальною).

Причина, по якій ви навряд чи отримаєте хороших результатів, використовуючи класифікаційні чи регресійні методи, полягає в тому, що ці методи зазвичай залежать від прогнозування умовного середнього значення даних, а екстремальні події зазвичай спричинені поєднанням "випадкових" факторів, що всі вирівнюються в одному напрямку, тому вони знаходяться в хвостах розподілу правдоподібних результатів, які зазвичай далекі від умовного середнього. Що ви можете зробити, це передбачити весь умовний розподіл, а не лише його середнє значення, і отримати деяку інформацію про ймовірність надзвичайної події, інтегруючи хвіст розподілу вище деякого порогу. Я виявив, що це добре працює у додатку щодо статистичного зменшення масштабів сильних опадів .


1
Чи є реалізація цієї теорії на пітоні?
користувач3378649

Вибачте, я не програмую в Python (поки що), тому не можу там допомогти.
Дікран Марсупіал

ух1,,хну>Y0П(у>Y0|х1,,хн)Е(у|х1,,хн)у>Y0П(у>Y0|х1,,хн)

Так, ви можете це зробити, однак функція витрат, яку ви мінімізуєте, не зосереджена на отриманні хвостів права розповсюдження, тому якщо саме це вас цікавить, краще спробувати моделювати події в хвостах більш чітко .
Дікран Марсупіал
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.