В одній із вправ мого курсу ми використовуємо медичний набір даних Kaggle .
Вправа говорить:
ми хочемо моделювати розподіл індивідуальних зарядів, і ми також дійсно хочемо мати можливість виявити нашу невизначеність щодо цього розподілу, щоб ми могли краще зафіксувати діапазон значень, який ми можемо побачити. Завантаження даних та виконання початкового перегляду:
З вищесказаного ми можемо підозрювати, що тут відбувається якесь експоненціальне поширення. ... Можливості нарахування страхових вимог можуть бути мультимодальними. Розподіл гами може застосовуватися, і ми можемо перевірити це на розподіл зборів, які були спочатку не страховими вимогами.
Я переглянув "Гамма-розподіл" і виявив "безперервне, лише позитивне, унімодальне розподіл, яке кодує час, необхідний для подій" альфа "в процесі Пуассона із середнім часом прибуття" бета ""
Тут немає часу, лише пов’язані між собою збори, застраховані чи ні.
Чому вони обрали б розподіл гами?