У мене є набір даних, який я б очікував, що слідкує за розповсюдженням Пуассона, але він перерозподілений приблизно в 3 рази. В даний час я моделюю цю наддисперсію, використовуючи щось подібне до наступного коду в Р.
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
Візуально це, здається, дуже добре відповідає моїм емпіричним даним. Якщо я задоволений пристосуванням, чи є якась причина, що я повинен робити щось складніше, як-от використовувати негативний біноміальний розподіл, як описано тут ? (Якщо так, будь-які вказівки чи посилання на це будуть дуже вдячні).
О, і я знаю, що це створює злегка нерівний розподіл (через множення на три), але це не має значення для мого застосування.
Оновлення: заради того, хто шукає і знайде це питання, ось проста функція R для моделювання перекритого пуассона за допомогою негативного біноміального розподілу. Встановіть d на бажане середнє / дисперсійне співвідношення:
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(через список розсилки R: https://stat.ethz.ch/pipermail/r-help/2002-June/022425.html )