У Вікіпедії є сторінка, на якій перераховано багато розподілів ймовірностей із посиланнями на більш детальну інформацію про кожен розподіл. Ви можете переглянути список і перейти за посиланнями, щоб краще відчути типи програм, для яких зазвичай використовуються різні дистрибутиви.
Просто пам’ятайте, що ці дистрибуції використовуються для моделювання реальності, і як сказав Box: «всі моделі неправильні, деякі моделі корисні».
Ось деякі поширені дистрибуції та деякі причини їх корисності:
Нормально: Це корисно для перегляду засобів та інших лінійних комбінацій (наприклад, коефіцієнтів регресії) через CLT. Це пов'язано з тим, що якщо щось, як відомо, виникає через адитивні ефекти багатьох різних малих причин, то нормальне може бути розумним розподілом: наприклад, багато біологічні заходи є результатом безлічі генів і численних факторів навколишнього середовища, і тому вони часто є приблизно нормальними .
Гамма: Правильно перекошений і корисний для речей з природним мінімумом в 0. Зазвичай використовується для минулих часів та деяких фінансових змінних.
Експонента: особливий випадок Гамма. Це без запам'ятовування і легко масштабує.
Chi-квадрат ( ): особливий випадок Гамма. Виникає як сума квадратних нормальних змінних (так використовується для варіацій).χ2
Бета-версія: визначається між 0 і 1 (але може бути перетворена на інші значення), корисна для пропорцій або інших величин, яка повинна бути від 0 до 1.
Двомісні: Скільки «успіхів» із заданої кількості незалежних випробувань з однаковою ймовірністю «успіху».
Пуассон: загальний для підрахунків. Приємні властивості: якщо кількість подій за певний проміжок часу або області слідує за Пуассоном, то число в два рази за час або область все ще слідує за Пуассоном (удвічі більше середнього): це працює для додавання Пуассона або масштабування зі значеннями, відмінними від 2.
Зауважте, що якщо події відбуваються в часі, а час між подіями слідує за експоненцією, то число, яке відбувається в проміжок часу, слідує за Пуассоном.
Негативний двочлен: підраховує мінімум 0 (або інше значення залежно від версії) та без верхньої межі. Концептуально це кількість "невдач" до k "успіхів". Негативний двочлен - це також суміш змінних Пуассона, засоби яких походять від гамма-розподілу.
Геометричний: особливий випадок для негативного двочлена, де це кількість "відмов" до 1-го "успіху". Якщо обрізати (округлити вниз) експоненціальну змінну, щоб зробити її дискретною, результат буде геометричним.
EstimatedDistribution
.