Розподіл, який описує різницю між негативними біноміальними розподіленими змінними?


18

Skellam Розподіл описує різницю між двома змінними , які мають розподіл Пуассона. Чи існує подібний розподіл, який описує різницю між змінними, які слідують за негативними біноміальними розподілами?

Мої дані виробляються методом Пуассона, але містять неабияку кількість шуму, що призводить до надмірної дисперсії в розповсюдженні. Таким чином, моделювання даних з негативним біноміальним (NB) розподілом добре працює. Якщо я хочу моделювати різницю між двома цими наборами даних NB, які мої варіанти? Якщо це допомагає, припустимо подібні засоби та дисперсію для двох наборів.


Існує багато дистрибутивів, які легко описати, які не мають стандартних назв.
Glen_b -Встановіть Моніку

Відповіді:


22

Я не знаю назви цього розподілу, але ви можете просто вивести його із закону повної ймовірності. Припустимо, мають негативні біноміальні розподіли з параметрами та відповідно. Я використовую параметризацію, де представляють кількість успіхів до відмов 'і ' відповідно. Потім,( r 1 , p 1 ) ( r 2 , p 2 ) X , Y r 1 r 2X,Y(r1,p1)(r2,p2)X,Yr1r2

P(XY=k)=EY(P(XY=k))=EY(P(X=k+Y))=y=0P(Y=y)P(X=k+y)

Ми знаємо

P(X=k+y)=(k+y+r11k+y)(1p1)r1p1k+y

і

P(Y=y)=(y+r21y)(1p2)r2p2y

так

P(XY=k)=y=0(y+r21y)(1p2)r2p2y(k+y+r11k+y)(1p1)r1p1k+y

Це не дуже (поступається!). Єдине спрощення, яке я бачу, є

p1k(1p1)r1(1p2)r2y=0(p1p2)y(y+r21y)(k+y+r11k+y)

що все ще досить некрасиво. Я не впевнений, чи це корисно, але це також можна переписати як

p1k(1p1)r1(1p2)r2(r11)!(r21)!y=0(p1p2)y(y+r21)!(k+y+r11)!y!(k+y)!

Я не впевнений, чи є спрощений вираз для цієї суми, але це може бути приблизно чисельним, якщо вам знадобиться лише для обчислення значеньp

Я симулятором перевірив, що наведений вище розрахунок є правильним. Ось сира функція R для обчислення цієї масової функції та проведення декількох моделювання

  f = function(k,r1,r2,p1,p2,UB)  
  {

  S=0
  const = (p1^k) * ((1-p1)^r1) * ((1-p2)^r2)
  const = const/( factorial(r1-1) * factorial(r2-1) ) 

  for(y in 0:UB)
  {
     iy = ((p1*p2)^y) * factorial(y+r2-1)*factorial(k+y+r1-1)
     iy = iy/( factorial(y)*factorial(y+k) )
     S = S + iy
  }

  return(S*const)
  }

 ### Sims
 r1 = 6; r2 = 4; 
 p1 = .7; p2 = .53; 
 X = rnbinom(1e5,r1,p1)
 Y = rnbinom(1e5,r2,p2)
 mean( (X-Y) == 2 ) 
 [1] 0.08508
 f(2,r1,r2,1-p1,1-p2,20)
 [1] 0.08509068
 mean( (X-Y) == 1 ) 
 [1] 0.11581
 f(1,r1,r2,1-p1,1-p2,20)
 [1] 0.1162279
 mean( (X-Y) == 0 ) 
 [1] 0.13888
 f(0,r1,r2,1-p1,1-p2,20)
 [1] 0.1363209

Я знайшов суму, що збігається дуже швидко для всіх значень, які я пробував, тому встановлювати UB вище 10 або близько того не потрібно. Зауважимо, що вбудована в функцію rnbinom функція R параметризує від'ємний двочлен з точки зору кількості відмов до -го успіху, і в цьому випадку вам потрібно буде замінити всі 'на наведені вище формули з сумісністю .rp1,p21p1,1p2


Спасибі. Мені знадобиться певний час, щоб переварити це, але ваша допомога дуже цінується.
chrisamiller

-2

Так. косий узагальнений дискретний розподіл Лапласа - це різниця двох негативних біноміальних розподілених випадкових величин. Для отримання додаткових роз’яснень зверніться до наявної в Інтернеті статті «Перекошений узагальнений дискретний розподіл Лапласа» сеет Лекшмі.В. і simi sebastian


4
Чи можете ви надати повне цитування та резюме інформації у статті, щоб майбутні читачі могли вирішити, чи потрібно це робити?
gung - Відновити Моніку

Стаття, згадана @ simi-sebastian (автором?), Є ijmsi.org/Papers/Volume.2.Issue.3/K0230950102.pdf . Однак, якщо я не помиляюся, він стосується лише випадку негативних біноміальних змінних і обидва мають однаковий параметр дисперсії, а не більш загальний випадок, описаний оригінальним плакатом. XY
Константинос
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.