Якщо у мене є дві незалежні випадкові величини X і Y, яка кореляція між X і продуктом XY? Якщо це невідомо, мені було б цікаво знати хоча б те, що відбувається в конкретному випадку X і Y нормально з нульовим значенням, якщо це легше вирішити.
Якщо у мене є дві незалежні випадкові величини X і Y, яка кореляція між X і продуктом XY? Якщо це невідомо, мені було б цікаво знати хоча б те, що відбувається в конкретному випадку X і Y нормально з нульовим значенням, якщо це легше вирішити.
Відповіді:
Я вважаю, що правильним рішенням буде рішення, яке виражає - якщо це можливо - співвідношення з точки зору окремих властивостей змінних і . Обчислення кореляції буде включати в себе обчислення коваріації одночленним в X і Y . Це економно зробити це все відразу. Просто спостерігайте за цим
Коли і Y незалежні, і i і j є ступенями, то і Y J є незалежними;
Очікування продукту незалежних змінних є результатом їх очікувань.
Це дасть формули в термінах моментів і Y .
Це все, що там є.
Напишіть тощо для моментів. Таким чином, для будь-яких чисел i , для яких обчислення мають сенс і дають кінцеві числа,
Зауважте, що дисперсія будь-якої випадкової величини є її коваріацією із самим собою, тому нам не потрібно робити спеціальних обчислень для дисперсій.
Тепер повинно бути очевидним, як обчислити моменти, пов’язані з одночленами, будь-якими силами, будь-якого обмеженого числа незалежних випадкових величин. Як додаток, застосуйте цей результат до визначення кореляції, яка є коваріацією, поділеною на квадратні корені дисперсій:
Існують різні алгебраїчні спрощення, які ви можете вибрати, якщо хочете пов’язати це з очікуваннями, відхиленнями та коваріаціями оригінальних змінних, але їх проведення тут не дасть більше розуміння.
Використовуючи закон тотальної коваріації та незалежності і Y , Cov ( X , X Y Використовуючи закон сумарної дисперсії і знову незалежності, Var ( X Y )
Перевірка цього результату за допомогою моделювання:
> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373
Лінійна кореляція між X і XY буде,
Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))
Cov (X, XY) = підсумовування ((середнє значення X (середнє значення X)) (середнє значення XY (XY)) / n
n - розмір вибірки; var (X) = дисперсія X; var (XY) = дисперсія XY