Яке розподіл закругленого середнього середніх випадкових величин Пуассона?


20

Якщо у мене є випадкові величини , які Пуассон розподілено з параметрами , який розподіл (тобто цілий поверх середнього)?X1,X2,,Xnλ1,λ2,,λnY=i=1nXin

Сума Пуассона - це також Пуассон, але я недостатньо впевнений у статистиці, щоб визначити, чи це те саме для вищезазначеного випадку.


@amoeba Я відмовив вашу редакцію заголовка, оскільки це насправді не "округлення". Попередня редакція кардинала, хоча і не настільки точна, здається кращою, оскільки вона точна.
whuber

@whuber Гаразд. Я вагався при внесенні цього редагування, але вирішив включити слово "округлення", оскільки наразі назва не натякає на основні труднощі тут (і так певним чином вводить в оману). Власний термін повинен бути "округленням вниз", тому, можливо, "Яке розподіл середнього значення серед випадкових змінних Пуассона, округлене вниз ?" - навіть якщо я визнаю, це звучить трохи громіздко.
амеба каже: Відновіть Моніку

@amoeba Подальші зміни, звичайно, вітаються!
whuber

Відповіді:


27

Узагальнення питання задає розподіл Y=X/m коли розподіл X відомий і підтримується на натуральних числах. (У запитанні X має пуассонівський розподіл параметра λ=λ1+λ2++λn і m=n .)

Розподіл Y легко визначається розподілом mY , ймовірність якого виробляє функція (PGF) може бути визначена в термінах PGF з X . Ось контур виведення.


Запишіть для pgf з , де (за визначенням) . будується з таким чином , що його PGF, , єX p n = Pr ( X = n ) m Y X qp(x)=p0+p1x++pnxn+Xpn=Pr(X=n)mYXq

q(x)=(p0+p1++pm1)+(pm+pm+1++p2m1)xm++(pnm+pnm+1++p(n+1)m1)xnm+.

Тому що це сходиться абсолютно за , ми можемо переставити терміни на суму частин форми|x|1

Dm,tp(x)=pt+pt+mxm++pt+nmxnm+

для . У статечної ряд функції складаються з будь-якого термін серії , починаючи з : це іноді називають проріджування з . Пошуки Google в даний час не виявляють багато корисної інформації щодо децимації, тому для повноти ось виведення формули.x t D m , t p m th p t th pt=0,1,,m1хтDм,тpмгоpтгоp

Нехай - будь-який примітивний корінь єдності; наприклад, візьміть . Тоді з і випливає, щоm th ω = exp ( 2 i π / m ) ω m = 1 m - 1 j = 0 ω j = 0ωмгоω=досвід(2iπ/м)ωм=1j=0м-1ωj=0

хтDм,тp(х)=1мj=0м-1ωтjp(х/ωj).

Щоб побачити це, зауважте, що оператор лінійний, тому достатньо перевірити формулу на основі . Застосування правої частини до дає { 1 , x , x 2 , , x n , } x nхтDм,т{1,х,х2,,хн,}хн

хтDм,т[хн]=1мj=0м-1ωтjхнω-нj=хнмj=0м-1ω(т-н)j.

Коли і відрізняються кратним , кожен доданок у сумі дорівнює і отримуємо . В іншому випадку умови переходять через повноваження і ці суми до нуля. Звідси цей оператор зберігає всі сили конгруентних до модуля і вбиває всі інші: це саме бажана проекція.n m 1 x n ω t - n x t mтнм1хнωт-нхтм

Формула легко випливає, змінюючи порядок підсумовування та визнаючи одну із сум геометричною, записуючи її в закритому вигляді:q

q(х)=т=0м-1(Dм,т[p])(х)=т=0м-1х-т1мj=0м-1ωтjp(ω-jх)=1мj=0м-1p(ω-jх)т=0м-1(ωj/х)т=х(1-х-м)мj=0м-1p(ω-jх)х-ωj.

Наприклад, pgf розподілу Пуассона параметра є . З , і pgf будеp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλp(х)=досвід(λ(х-1))м=2ω=-12Y

q(x)=x(1x2)2j=021p((1)jx)x(1)j=x1/x2(exp(λ(x1))x1+exp(λ(x1))x+1)=exp(λ)(гріх(λх)х+кошовий(λх)).

Одним із застосувань такого підходу є обчислення моментів та . Значення похідної pgf, оцінене на є факторіальним моментом . момент є лінійною комбінацією перших факторних моментів. Використовуючи ці спостереження, ми знаходимо, наприклад, що для Пуассона, розподіленого , його середнє значення (що є першим факторіальним моментом) дорівнює , середнє значення дорівнює , а середнє значення дорівнюєm Y k th x = 1 k th k th k X λ 2 ( X / 2 ) λ - 1ХмYкгох=1кгокгокХλ2(Х/2)3(X/3)λ-1+e-3λ/2(sin ( λ-12+12е-2λ3(Х/3)λ-1+е-3λ/2(гріх(3λ2)3+cos(3λ2)) :

Засоби

Засоби для показані синім, червоним та жовтим кольорами відповідно як функції : асимптотично, середнє падіння на порівняно з вихідним середнім значенням Пуассона.м=1,2,3λ(m1)/2

Подібні формули для дисперсій можна отримати. (Вони стають безладними, коли зростає і так опускається. Одне, що вони остаточно встановлять, це те, що коли жоден кратний є Пуассоном: він не має характерної рівності середнього та дисперсії) Ось сюжет дисперсій як функція для :mm>1Yλm=1,2,3

Варіанти

Цікаво, що для більших значень дисперсії збільшуються . Інтуїтивно це пов'язано з двома конкуруючими явищами: функція підлоги ефективно поєднує групи значень, які спочатку були виразними; це повинно призвести до зменшення дисперсії . У той же час, як ми бачили, кошти теж змінюються (адже кожен контейнер представлений найменшим значенням); це повинно викликати доданий термін, рівний квадрату різниці засобів. Збільшення дисперсії для великих стає більшим при більших значеннях .λλm

Поведінка дисперсії з напрочуд складна. Закінчимо швидке моделювання (в ), що показує, що він може зробити. показують різницю між дисперсією та дисперсією для Пуассона, розподіленого з різними значеннями варіюються від до . У всіх випадках сюжети, схоже, досягли своїх асимптотичних значень праворуч.mYmRmX/mXXλ15000

set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
  x <- rpois(20000, lambda)
  v <- sapply(1:floor(lambda + 4*sqrt(lambda)), 
              function(m) var(floor(x/m)*m) - var(x))
  plot(v, type="l", xlab="", ylab="Increased variance", 
       main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})

Сюжети


1
Це чудова відповідь! Можливо, мені знадобиться деякий час, щоб переварити :)
Любо Антонов

1
і саме тому я сказав: "Використання функції підлоги ... занадто впливає на дисперсію, хоч і складніше".
Генріх

1
+1 Дякую за детальну відповідь. Звичайно, є складні способи, коли функція підлоги впливає на дисперсію.
Діліп Сарват

1
+1 для моделювання в R з кодом --- це дуже приємний приклад використання sapply()для моделювання. Спасибі.
Асад Ебрагім

1
@Roberto Дякую Однак відмінність між " " і " ", будучи суто питанням нотації, є абсолютно тривіальною і не має жодного математичного чи статистичного значення. xс
whuber

12

Як каже Майкл Черник, якщо окремі випадкові величини незалежні, то сума - Пуассон з параметром (середнім і дисперсією) який можна назвати . λi=1nλiλ

Ділення на зменшує середнє значення на та дисперсію тому дисперсія буде меншою, ніж еквівалентний розподіл Пуассона. Як каже Майкл, не всі значення будуть цілими числами.λ / n λ / n 2nλ/nλ/n2

Використання функції підлоги трохи зменшує середнє значення, приблизно на , і впливає на дисперсію теж трохи, хоч і складніше. Хоча у вас є цілі значення, дисперсія все одно буде значно меншою від середньої, і тому у вас буде вузьке розподіл, ніж Пуассон.1212n


дякую, не результат, який я можу використати, але принаймні я знаю зараз :)
Любо Антонов,

Якщо лямбди не всі рівні, чи не повинен результат бути більше схожим на негативний двочлен, ніж Пуассон (на даний момент ігноруючи не цілу частину)? Що я тут пропускаю?
gung - Відновіть Моніку

2
@gung: Ви пропускаєте пункт про те, що окремі впливають на розподіл лише через їх суму та кількість їх. Не має значення, які конкретні значення вони приймають: дасть такий самий результат, як . λ 1 = 1 , λ 2 = 2 , λ 3 = 9 λ 1 = 4 , λ 2 = 4 , λ 3 = 4λiλ1=1,λ2=2,λ3=9λ1=4,λ2=4,λ3=4
Генрі

10

n iXiXiλiλ=iλi

P{i=1nXi=k}=exp(λ)λkk!,  k=0,1,2,,
Y^=n1i=1nXik/nexp(λ)λkk!Y^Y=Y^m
П{Y=м}=П{1нi=1нХi=м}=досвід(-λ)i=0н-1λмн+i(мн+i)!,  м=0,1,2,,
λн

Y

Дякуємо за сувору формулювання! Будь-який шанс, що ви хочете взяти тріщину у формулах для середнього та відхилення?
Любо Антонов

2
Можливо, @whuber опублікує посилання (або цитування книги чи статті журналу), де можна знайти формули закритого типу для моментів, або напише відповідь, даючи самі формули, з детальним виведенням або без нього.
Діліп Сарват

@Dilip Моя претензія щодо закритих формул не ґрунтувалася на нічого опублікованого, тому я опублікував окрему відповідь із зазначенням того, що я мав на увазі, і як це можна використовувати для розуміння цієї ситуації.
whuber

3

Y не буде Пуассоном. Зауважимо, що випадкові величини Пуассона приймають цілісні значення, що не мають негативного значення. Після поділу на константу ви створюєте випадкову змінну, яка може мати не цілі значення. Він все одно матиме форму Пуассона. Просто дискретні ймовірності можуть виникати в не цілих точках.


Y

@ lucas1024 Я так не думаю, але я не впевнений.
Майкл Р. Черник

Xin1

@JDav Сума - Пуассон з параметром курсу, рівним сумі окремих параметрів швидкості. Але ОП масштабує на 1 / n, а потім хоче скоротити ціле число трохи нижче Y. Я не знаю точно, що це робить з розподілом.
Майкл Р. Черник

Мій попередній коментар набув незалежності.
Майкл Р. Черник
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.