Пуассон - це експоненціальна, як до чого гамма-Пуассон?


16

Розподіл Пуассона може вимірювати події за одиницю часу, а параметр - . Експонентний розподіл вимірює час до наступної події параметром . Можна перетворити один розподіл в інший, залежно від того, чи легше моделювати події чи час.1λ1λ

Тепер гамма-пуассон - це "розтягнутий" пуассон з більшою дисперсією. Розподіл Вейбула - це "розтягнута" експоненція з більшою дисперсією. Але чи можна ці два легко перетворити один на одного, таким же чином, як Пуассон може бути перетворений в експоненціальний?

Або є якийсь інший розподіл, який доцільніше використовувати в поєднанні з розподілом гамма-пуассона?

Гамма-пуассон також відомий як негативний біноміальний розподіл, або NBD.

Відповіді:


14

Це досить пряма проблема вперед. Хоча існує зв'язок між пуассоновим та негативним біноміальними розподілами, я фактично вважаю, що це не корисно для вашого конкретного питання, оскільки це спонукає людей думати про негативні біноміальні процеси. В основному у вас є серія процесів Пуассона:

Yi(ti)|λiPoisson(λiti)

Де - це процес, а t i - це час, коли ви його спостерігаєте, і я позначає індивідів. А ви говорите, що ці процеси "схожі", пов'язавши ставки разом з розподілом:Yitii

λiГамма(α,β)

Здійснюючи інтеграцію / mxixing над , у вас є:λi

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

Це має pmf:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

Для отримання розподілу часу очікування зазначимо, що:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

Диференціюйте це і у вас є PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Це член узагальнених розподілів Парето, тип II. Я б використовував це як розподіл часу очікування.

Щоб побачити зв’язок з розподілом Пуассона, зауважте, що , так що якщо встановити β = ααβ=E(λi|αβ) а потім беремо границюα∞,отримуємо:β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

Це означає, що ви можете інтерпретувати як параметр наддисперсії.1α


1
Ви також можете відзначити, що розподіл часу очікування - це, грубо кажучи, експоненціальний розподіл з параметром випадкової швидкості Гамма і строго кажучи, це бета-розподіл другого роду, як і для будь-якого розподілу Гамми з параметром випадкової швидкості Гамма.
Стефан Лоран

Використовуючи @probabilityislogic в якості основи, я знайшов наступну статтю, що надає більш детальну інформацію про взаємозв'язок між NBD та Парето: Гупта, Суніл та Дональд Г. Моррісон. Оцінка гетерогеніту в курсах закупівель споживачів. Маркетингова наука, 1991, 10 (3), 264-269. Дякую всім, хто допоміг мені відповісти на це питання.
zbicyclist

+1, я думаю, ця приємна аналітична форма може більше не існувати для , де cPoisson(λiti+c)c - константа.
Рендел

1
@randel - ви можете отримати форму "nice-ish", зазначивши, що цей rv є сумою двох незалежних rvs ... де Y i - те саме, що вище, а X ip o i s s o n ( c ) . Оскільки X i не залежить від λ i чи Y i, pdf Z i - це згортання вищезазначених негативних біноміальних pdf та poisson pdf. Щоб отримати розподіл часу очікування, просто помножте P rZi=Yi+XiYiXipoisson(c)XiλiYiZi у наведеній вище відповіді P r ( X i = 0 ) = e - c . Потім ви отримуєте час очікування cdf 1 - e - c ( 1 + t iPr(Yi=0)Pr(Xi=0)=ecі pdfe-cα1ec(1+tiβ)α. ecαβ(1+tiβ)(α+1)
ймовірністьлогічний

1
Це не буде працювати з точки зору розподілу змішування, оскільки вам потрібно (інакше середнє значення пуассона негативне). Розподіл гамма-змішування повинен бути скорочений (я також припускав, що c > 0 у попередній відповіді). Це означатиме відсутність розподілу nb. λi<cti1c>0
ймовірністьлогічний

4

Одна з можливостей: Пуассон - це експоненціальна, як негативно-двочленна - це ... Експоненціальна!

Існує чистий стрибок у зростаючому процесі Леві, який називається негативним біноміальним процесом, таким чином, що в момент часу значення має негативне біноміальне розподіл. На відміну від процесу Пуассона, стрибки майже не впевнені 1 . Натомість вони слідують логарифмічному розподілу . За законом тотальної дисперсії частина дисперсії походить від кількості стрибків (масштабується середній розмір стрибків), а частина дисперсії походить від розмірів стрибків, і ви можете використовувати це, щоб перевірити, чи це є наддисперсним.t1

Можуть бути й інші корисні описи. Див. "Обрамлення негативного біноміального розподілу для секвенування ДНК".


Дозвольте мені більш чітко розповісти про те, як може бути побудований описаний вище негативний біноміальний процес.

  • Виберіть .p<1

  • Нехай бути IID з логарифмічними розподілами, тому P ( x i = k ) = - 1X1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • Nlog(1p)N(t)=Pois(tlog(1p)).

  • NBP

NBP(t)=i=1N(t)Xi.

NBPlog(1p).

I don't think it is obvious from this description that NBP(t) has a negative binomial NB(t,p) distribution, but there is a short proof using probability generating functions on Wikipedia, and Fisher also proved this when he introduced the logarithmic distribution to analyze the relative frequencies of species.


1
No, any compound Poisson process has an exponential waiting time. This means you add Pois(λt) IID random variables with some distribution.
Douglas Zare

No, that is not what is meant by a compound Poisson process. en.wikipedia.org/wiki/Compound_Poisson_process " The jumps arrive randomly according to a Poisson process and the size of the jumps is also random, with a specified probability distribution." I did not say IID Poisson variables. You take the Nth partial sum of IID logarithmic random variables where N is the value of a Poisson process.
Douglas Zare

If you multiply a Poisson process by 2, this is not a Poisson process and the waiting times remain exponential.
Douglas Zare


0

I am not able to comment yet so I apologize is this isn't a definitive solution.

You are asking for the appropriate distribution to use with an NB but appropriate isn't entirely defined. If an appropriate distribution means appropriate for explaining data and you are starting with an overdispersed Poisson then you may have to look further into the cause of the overdispersion. The NB doesn't distinguish between a Poisson with heterogeneous means or a positive occurrence dependence (that one event occurring increases the probability of another occurring). In continuous time there is also duration dependence, eg positive duration dependence means the passage of time increases the probability of an occurrence. It was also shown that negative duration dependence asymptotically causes an overdispersed Poisson[1]. This adds to the list of what might be the appropriate waiting time model.


1
cause of the overdispersion: This is consumer purchase data. Individual consumers are poisson, each with a rate of purchase lambda. But not every consumer has the same lambda -- that's the cause of the overdispersion. The lambda purchasing rates are considered to be distributed as gamma. This is a common model (traces back to A.S.C. Ehrenberg), but I haven't found anything in his writing that answers this question.
zbicyclist
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.