Варіантність добутку k корельованих випадкових величин


Відповіді:


12

Більш детальну інформацію по цій темі, ніж вам, мабуть, потрібно, можна знайти в Goodman (1962): "Варіантність добутку K випадкових змінних" , де виводяться формули як незалежних випадкових змінних, так і потенційно корельованих випадкових змінних, а також деякі наближення. У попередній роботі ( Goodman, 1960 ) була виведена формула добутку з точно двох випадкових змінних, яка є дещо простішою (хоча все ще досить загальною), так що це може бути кращим місцем для початку, якщо ви хочете зрозуміти виведення .

Для повноти, однак, йде так.

Дві змінні

Припустимо наступне:

  • уx і - дві випадкові величиниy
  • YX і це їхні (ненульові) очікуванняY
  • V ( y )V(x) і - їх відмінністьV(y)
  • δ yδx=(xX)/X (і аналогічно для )δy
  • Di,j=E[(δx)i(δy)j]
  • Δ yΔx=xX (і аналогічно для )Δy
  • Ei,j=E[(Δx)i(Δy)j]
  • V ( x ) / X 2 G ( Y )G(x) - коефіцієнт зміни квадрату: (аналогічно )V(x)/X2G(Y)

Тоді: або рівнозначно:

V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2D1,12]

V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12

Більше двох змінних

Документ 1960 р. Припускає, що ця вправа для читача (яка, здається, мотивувала документ 1962 року!).

Позначення подібні з кількома розширеннями:

  • (x1,x2,xn) - випадкові величини замість таxy
  • M=E(i=1kxi)
  • A=(M/i=1kXi)1
  • si = 0, 1 або 2 дляi=1,2,k
  • u = кількість 1 у(s1,s2,sk)
  • m = кількість 2-х в(s1,s2,sk)
  • D(u,m)=2u2 для і для ,m=02um>1
  • C(s1,s2,,sk)=D(u,m)E(i=1kδxisi)
  • s1sk вказує підсумовування наборів де3kk1(s1,s2,sk)2m+u>1

Потім, нарешті:

V(i=1kxi)=Xi2(s1skC(s1,s2sk)A2)

Докладні відомості та трохи більш простежувані наближення див. У документах!


зауважте, що вищевказана відповідь від Метта Краузе містить помилку, як і сам документ. У визначенні функції C (s1, ..., sk) це повинен бути добуток замість суми.
Ніколя Гіслер

Не могли б ви детальніше розробити ..? "Тому що я - анонімна людина з Інтернету - кажу так" - це насправді не відповідь ...
Тім

Якщо ви спробуєте отримати varance var (x * y) для незалежних випадкових величин, за допомогою формули для довільних k ви можете побачити, що правильний відповідь дає лише добуток, а не сума. Крім того, якщо ви подивитеся на папір, ви також можете це побачити, на сторінці 59 статті (принаймні в моїй версії) він використав продукт замість суми.
Ніколя Гіслер

1
У випадку з двома випадковими змінними, у цій відповіді за допомогою @macro можна знайти просту формулу для дисперсії добутку двох корельованих випадкових змінних . Ця відповідь також вказує на істотну проблему в . Е. Товща позначення приховує істотний факт, що в ньому є терміни, значення яких неможливо визначити, якщо ми не знаємо cov , або достатньо про щільність стику двох випадкових величин, щоб визначити цю величину.
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12,
(x2,y2)
Діліп Сарват

Пропозиція редагування, яка справді мала б бути коментарем, передбачає, що в первинному документі міститься помилка друку, де сума і продукт змішуються, і цю відповідь слід внести зміни. Дивіться stats.stackexchange.com/review/sugges-edits/83662
Silverfish

4

Просто додати до дивовижної відповіді Метта Крауза (насправді легко вивести звідти). Якщо x, y незалежні, то

E1,1=E[(xE[x])(yE[y])]=Cov(x,y)=0E1,2=E[(xE[x])(yE[y])2]=E[xE(x)]E[(yE[y])2]=(E[x]E[x])E[(yE[y])2]=0E2,1=0E2,2=E[(xE[x])2(yE[y])2]=E[(xE[x])2]E[(yE[y])2=V[x]V[y]V[xy]=E[x]2V[y]+E[y]2V[x]+V[x]V[y]

1
Результат для випадку незалежних випадкових величин тут обговорювався . n
Діліп Сарват

3

На додаток до загальної формули, наданої Меттом, можливо, варто відзначити, що існує дещо більш чітка формула для нульових середніх гауссових випадкових величин. Це випливає з теореми Іссерліса , див. Також Вищі моменти для централізованого багатоваріантного нормального розподілу.

Припустимо, що слід багатоваріантного нормального розподілу із середнім 0 та коваріаційною матрицею . Якщо кількість змінних непарна, і де означає суму по всіх розділах на неперервні пари кожен термін є продуктом відповідних 's та де Σ k ˜ Σ i , j ˜ Σ(x1,,xk)ΣkE(ixi)=0

V(ixi)=E(ixi2)=Σ~i,j
Σ{1,,2k}k{i,j}k Σ~i,j
Σ~=(ΣΣΣΣ)
- матриця коваріації для . Якщо парне, У випадку отримаємо Якщо отримаємо де в сумі є 15 доданків.(x1,,xk,x1,,xk)k
V(ixi)=Σ~i,j(Σi,j)2.
k=2
V(x1x2)=Σ1,1Σ2,2+2(Σ1,2)2Σ1,22=Σ1,1Σ2,2+(Σ1,2)2.
k=3
V(x1x2x3)=Σi,jΣk,lΣr,t,

Насправді можна реалізувати загальну формулу. Найважчою частиною виявляється обчислення необхідних розділів. У R це можна зробити за допомогою функції setpartsз пакету partitions. Використовуючи цей пакет, не було проблем генерувати 2,027,025 розділів для , 34,459,425 розділів для можна також генерувати, але не 654 729,075 розділів для (на моєму ноутбуці 16 ГБ).k = 9 k = 10k=8k=9k=10

Пару інших речей варто відзначити. По-перше, для гауссових змінних з ненульовим середнім значенням повинно бути можливим і вираз з теореми Іссерліса. По-друге, незрозуміло (для мене), чи наведена вище формула є надійною щодо відхилень від нормальності, тобто якщо вона може бути використана як апроксимація, навіть якщо змінні не є багатоваріантними нормально розподіленими. По-третє, хоча формули, наведені вище, є правильними, сумнівно, наскільки дисперсія говорить про розподіл продуктів. Навіть для розподіл продукту є досить лептокуртичним, а для більшого він швидко стає надзвичайно лептокуртичним.kk=2k


Акуратний підхід! Для чого це варто, формула моєї відповіді також має комбінаторний вибух: підсумовування над C включає підсумовування доданків. O(3k)
Метт Крауз
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.