"За замовчуванням", найбільш часто використовуваний та описаний, розподіл вибору для даних підрахунку - розподіл Пуассона . Найчастіше це проілюстровано на прикладі першого практичного використання:
Практичне застосування цього розподілу здійснив Ладислав Борткевич у 1898 р., Коли йому було надано завдання дослідити кількість солдатів прусської армії, випадково вбитих кінськими ногами; цей експеримент представив розподіл Пуассона в галузі інженерної надійності.
λλ
Е( Y| Х, β) = λ = exp( β0+ β1Х1+ ⋯ + βкХк)
λ
Проблема використання розподілу Пуассона для даних реального життя полягає в тому, що він передбачає, що він буде рівним дисперсії. Порушення цього припущення називається наддисперсією . У таких випадках ви завжди можете використовувати модель квазі-Пуассона , не-пуассонівську лінійно-лінійну модель (для великих рахунків Пуассона можна наблизити за нормальним розподілом), негативну біноміальну регресію (тісно пов'язану з Пуассоном; див. Берк та Макдональд, 2008) або інші моделі, як описано Стефаном Коласом .
Для дружнього ознайомлення з регресією Пуассона ви також можете ознайомитись з документами Lavery (2010) або Coxe, West та Aiken (2009).
Лавери, Р. (2010). Анімований посібник: вступ до пуассонової регресії. NESUG папір, sa04.
Coxe, S., West, SG, & Aiken, LS (2009). Аналіз даних підрахунку: щадне вступ до пуассонової регресії та її альтернатив. Журнал оцінки особистості, 91 (2), 121-136.
Berk, R., & MacDonald, JM (2008). Перенапруження та пуассонова регресія. Журнал кількісної кримінології, 24 (3), 269-284.