Який розподіл вірогідності цієї випадкової суми неіідних змінних Бернуллі?


9

Я намагаюся знайти розподіл ймовірності суми випадкової кількості змінних, які не однаково розподілені. Ось приклад:

Джон працює в центрі обслуговування клієнтів. Він отримує дзвінки з проблемами і намагається їх вирішити. Ті, кого він не може вирішити, він передає їх своєму начальнику. Припустимо, що кількість дзвінків, які він отримує за день, слід за розподілом Пуассона із середнім . Складність кожної проблеми варіюється від досить простих речей (з якими він точно може впоратися) до дуже спеціалізованих питань, які він не знатиме, як вирішити. Припустимо, що ймовірність він зможе вирішити i - ту проблему, слід за розподілом Beta з параметрами і і не залежить від попередніх проблем. Яке розподіл кількості дзвінків він вирішує за день?мкpiαβ

Більш офіційно у мене є:

Y=Я(N>0)i=0NХi дляi=0,1,2,...,N

де , таNПоiссон(мк)(Хi|pi)Беrноуллi(pi)piБета(α,β)

Зауважте, що наразі я радий припустити, що незалежні. Я б також прийняв, що параметри іХiмк,αβ не впливають один на одного, хоча в реальному прикладі цього коли мк великий, параметри α і β такі, що бета-дистрибуція має більшу масу при низьких показниках успішності p. Але давайте ігноруємо це поки.

Я можу розрахувати П(Y=0)але ось про це. Я також можу імітувати значення, щоб отримати уявлення про те, що таке розподілY схоже (це схоже на Пуассона, але я не знаю, чи це до числа мк,α і βЯ спробував чи узагальнює, і як це може змінитися для різних значень параметрів). Будь-яке уявлення про те, що це за розподіл чи як я можу піти про його отримання?

Зверніть увагу, що я також розмістив це питання на форумі TalkStats, але я подумав, що він може отримати більше уваги тут. Вибачте за перехресне повідомлення та заздалегідь дякую за ваш час.

EDIT : Як виявляється (див. Дуже корисні відповіді нижче - і дякую за це!), Це справді аПоiссон(мкαα+β)розподіл - те, про що я здогадувався, виходячи зі своєї інтуїції та деяких симуляцій, але не зміг довести. Однак мене зараз дивує те, що розподіл Пуассона залежить лише від середнього значенняБета розповсюдження, але його зміна не впливає.

Наприклад, наступні два бета-розподіли мають однакове середнє значення, але різну дисперсію. Для наочності синій pdf являє собою aБета(2,2) і червоний Beta(0.75,0.75).

Бета-розподіли

Однак і те, і інше призведе до однакового Poisson(0.5μ)розподіл, який мені здається трохи протиінтуїтивним. (Не кажучи, що результат неправильний, просто дивно!)


Для фіксованих Nіснує пуассоно-біноміальне розподіл, але ваша проблема є складнішою, ніж ця.
Тім

Дякую, я знаю про пуассоно-біноміальне розподіл, але Nтут випадковий.
Константинос

Ви можете поглянути на склад Пуассона , але вам може знадобитися зробити деяку роботу з 0, щоб зробити це корисним
Glen_b -Встановіть Моніку

Відповіді:


6

Дзвінки (тобто Хi) прибути відповідно до процесу Пуассона. Загальна кількість дзвінківNслід розподілу Пуассона. Розділіть дзвінки на два типи, наприклад, чиХi=1 або Хi=0. Мета - визначити процес, що генерує1с. Це банально, якщоХi=1 з фіксованою ймовірністю p: за принципом суперпозиції процесів Пуассона, повний процес стоншується до просто 1s також був би процес Пуассона зі швидкістю pмк. Насправді це так, нам просто потрібен додатковий крок, щоб потрапити туди.

Маргіналізація над pi, так що

Пr(Хi|α,β)=01piХi(1-pi)1-Хipiα-1(1-pi)β-1Б(α,β)гpi=Б(Хi+α,1-Хi+β)Б(α,β)

Де Б(а,б)=Γ(а)Γ(б)Γ(а+б)- це бета-функція. Використовуючи те, щоΓ(х+1)=хΓ(х), вищесказане спрощує до;

Пr(Хi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
Іншими словами, ХiБеrноуллi(αα+β). За властивістю суперпозиції,Y Пуассон розподіляється зі швидкістю αмкα+β.

Числовий приклад (з R) ... на малюнку вертикальні лінії є від імітації, а червоні точки - pmf, отримані вище:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

введіть тут опис зображення


3
  1. З тих пір pi - випадкова величина з a Бета-версія(α,β) ти маєш Е[pi]=αα+β і це насправді ймовірність того, що Джон насправді вирішує це iта проблема, незалежно від усіх інших.

  2. Оскільки загальна кількість проблем за день має розподіл Пуассона з параметром мк і кожен буде вирішений з вірогідністю αα+β, число, яке Джон вирішує щодня, має розподіл Пуассона з параметром мкαα+β

  3. Ваш розрахунок ймовірності він не вирішує жодних проблем П(Y=0)=е-мкα/(α+β)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.