Узагальнення питання задає розподіл Y=⌊X/m⌋ коли розподіл X відомий і підтримується на натуральних числах. (У запитанні X має пуассонівський розподіл параметра λ=λ1+λ2+⋯+λn і m=n .)
Розподіл Y легко визначається розподілом mY , ймовірність якого виробляє функція (PGF) може бути визначена в термінах PGF з X . Ось контур виведення.
Запишіть для pgf з , де (за визначенням) . будується з таким чином , що його PGF, , єX p n = Pr ( X = n ) m Y X qp(x)=p0+p1x+⋯+pnxn+⋯Xpn=Pr(X=n)mYXq
q(x)=(p0+p1+⋯+pm−1)+(pm+pm+1+⋯+p2m−1)xm+⋯+(pnm+pnm+1+⋯+p(n+1)m−1)xnm+⋯.
Тому що це сходиться абсолютно за , ми можемо переставити терміни на суму частин форми|x|≤1
Dm,tp(x)=pt+pt+mxm+⋯+pt+nmxnm+⋯
для . У статечної ряд функції складаються з будь-якого термін серії , починаючи з : це іноді називають проріджування з . Пошуки Google в даний час не виявляють багато корисної інформації щодо децимації, тому для повноти ось виведення формули.x t D m , t p m th p t th pt=0,1,…,m−1xtDm,tpmthptthp
Нехай - будь-який примітивний корінь єдності; наприклад, візьміть . Тоді з і випливає, щоm th ω = exp ( 2 i π / m ) ω m = 1 ∑ m - 1 j = 0 ω j = 0ωmthω=exp(2iπ/m)ωm=1∑m−1j=0ωj=0
xtDm,tp(x)=1m∑j=0m−1ωtjp(x/ωj).
Щоб побачити це, зауважте, що оператор лінійний, тому достатньо перевірити формулу на основі . Застосування правої частини до дає { 1 , x , x 2 , … , x n , … } x nxtDm,t{1,x,x2,…,xn,…}xn
xtDm,t[xn]=1m∑j=0m−1ωtjxnω−nj=xnm∑j=0m−1ω(t−n)j.
Коли і відрізняються кратним , кожен доданок у сумі дорівнює і отримуємо . В іншому випадку умови переходять через повноваження і ці суми до нуля. Звідси цей оператор зберігає всі сили конгруентних до модуля і вбиває всі інші: це саме бажана проекція.n m 1 x n ω t - n x t mtnm1xnωt−nxtm
Формула легко випливає, змінюючи порядок підсумовування та визнаючи одну із сум геометричною, записуючи її в закритому вигляді:q
q(x)=∑t=0m−1(Dm,t[p])(x)=∑t=0m−1x−t1m∑j=0m−1ωtjp(ω−jx)=1m∑j=0m−1p(ω−jx)∑t=0m−1(ωj/x)t=x(1−x−m)m∑j=0m−1p(ω−jx)x−ωj.
Наприклад, pgf розподілу Пуассона параметра є . З , і pgf будеp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλp(x)=exp(λ(x−1))m=2ω=−12Y
q( х )= x ( 1 - x- 2)2∑j = 02 - 1p ( ( - 1 )−jx)x−(−1)j=x−1/x2(exp(λ(x−1))x−1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Одним із застосувань такого підходу є обчислення моментів та . Значення похідної pgf, оцінене на є факторіальним моментом . момент є лінійною комбінацією перших факторних моментів. Використовуючи ці спостереження, ми знаходимо, наприклад, що для Пуассона, розподіленого , його середнє значення (що є першим факторіальним моментом) дорівнює , середнє значення дорівнює , а середнє значення дорівнюєm Y k th x = 1 k th k th k X λ 2 ⌊ ( X / 2 ) ⌋ λ - 1Хм Yкгох = 1кгокгокХλ2 ⌊ ( X/ 2)⌋3⌊(X/3)⌋λ-1+e-3λ/2(sin ( √λ - 12+ 12е- 2 λ3 ⌊ ( X/ 3)⌋λ - 1 + е- 3 λ / 2( гріх( 3√λ2)3√+ cos( 3√λ2) ) :
Засоби для показані синім, червоним та жовтим кольорами відповідно як функції : асимптотично, середнє падіння на порівняно з вихідним середнім значенням Пуассона.m = 1 , 2 , 3λ(m−1)/2
Подібні формули для дисперсій можна отримати. (Вони стають безладними, коли зростає і так опускається. Одне, що вони остаточно встановлять, це те, що коли жоден кратний є Пуассоном: він не має характерної рівності середнього та дисперсії) Ось сюжет дисперсій як функція для :mm>1Yλm=1,2,3
Цікаво, що для більших значень дисперсії збільшуються . Інтуїтивно це пов'язано з двома конкуруючими явищами: функція підлоги ефективно поєднує групи значень, які спочатку були виразними; це повинно призвести до зменшення дисперсії . У той же час, як ми бачили, кошти теж змінюються (адже кожен контейнер представлений найменшим значенням); це повинно викликати доданий термін, рівний квадрату різниці засобів. Збільшення дисперсії для великих стає більшим при більших значеннях .λλm
Поведінка дисперсії з напрочуд складна. Закінчимо швидке моделювання (в ), що показує, що він може зробити. показують різницю між дисперсією та дисперсією для Пуассона, розподіленого з різними значеннями варіюються від до . У всіх випадках сюжети, схоже, досягли своїх асимптотичних значень праворуч.mYmR
m⌊X/m⌋XXλ15000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})