Інтуїція за формулою дисперсії суми двох змінних


10

Я знаю з попередніх досліджень, що

Var(A+B)=Var(A)+Var(B)+2Cov(A,B)

Однак я не розумію, чому це так. Я бачу, що ефектом буде «підштовхувати» дисперсію, коли A і B коварі сильно. Має сенс, що коли ви створюєте композит із двох сильно корельованих змінних, ви, як правило, додавати високі спостереження від A до високих спостережень від B, а низькі спостереження від A з низькими спостереженнями від B. Це, як правило, створюють надзвичайно високі та низькі значення в складовій змінній, збільшуючи дисперсію композиту.

Але чому це працює, щоб помножити коваріацію рівно на 2?


1
Якщо і ідеально позитивно співвідносяться, то і якщо вони ідеально негативно співвідносяться, то . Коваріація вимірює, наскільки далеко за цим діапазоном їхні стосункиB V a r ( A + B ) = V a r ( A ) + V a r ( B ) + 2 AB Var(A+B)=Var(A)+Var(B)-2Var(A+B)=Var(A)+Var(B)+2Var(A)Var(B)Var(A+B)=Var(A)+Var(B)2Var(A)Var(B)
Генрі

Відповіді:


21

Проста відповідь:

Дисперсія включає квадрат:

Var(X)=E[(XE[X])2]

Отже, ваше питання зводиться до коефіцієнта 2 у квадратній ідентичності:

(a+b)2=a2+b2+2ab

Що візуально можна зрозуміти як декомпозицію площі квадрата сторони на площу менших квадратів сторін і , крім двох прямокутників сторін і :a b a b(a+b)abab

введіть тут опис зображення

Більше залучена відповідь:

Якщо ви хочете відповісти математично більше, коваріація є білінеарною формою, це означає, що вона є лінійною і в першому, і в другому аргументах, це призводить до:

Var(A+B)=Cov(A+B,A+B)=Cov(A,A+B)+Cov(B,A+B)=Cov(A,A)+Cov(A,B)+Cov(B,A)+Cov(B,B)=Var(A)+2Cov(A,B)+Var(B)

В останньому рядку я використав той факт, що коваріація симетрична:

Cov(A,B)=Cov(B,A)

Підсумовуючи:

Це два, тому що ви повинні враховувати як і .c o v ( B , A )cov(A,B)cov(B,A)


5

Сукупність випадкових змінних є векторним простором, і багато властивостей евклідового простору можуть бути аналогічними їм. Стандартне відхилення діє так, як довжина, а дисперсія, як довжина у квадраті. Незалежність відповідає ортогональності, тоді як ідеальна кореляція відповідає скалярному множенню. Таким чином, дисперсія незалежних змінних слідує теоремі Піфагора: .
var(A+B)=var(A)+var(B)

Якщо вони ідеально співвідносяться, то
std(A+B)=std(A)+std(B)

Зауважте, що це еквівалентно
var(A+B)=var(A)+var(B)+2var(A)var(B)

Якщо вони не є незалежними, вони дотримуються закону, аналогічного закону косинусів:
var(A+B)=var(A)+var(B)+2cov(A,B)

Зауважимо, що загальний випадок - це між повною незалежністю та ідеальною кореляцією. Якщо і незалежні, то дорівнює нулю. Таким чином , в загальному випадку є те , що завжди має термін і член, а потім вона має деякі варіації на термін ; чим більше співвідносних змінних, тим більшим буде цей третій член. І це саме те , що є: це раз з і .B c o v ( A , BABv a r ( A , B ) v a r ( A ) v a r ( B ) 2 cov(A,B)var(A,B)var(A)var(B) 2cov(A,B)22var(A)var(B)2cov(A,B) r2AB2var(A)var(B)r2AБ

vаr(А+Б)=vаr(А)+vаr(Б)+МеасуrеОfСоrrелатiонПеrfеcтСоrrелатiонТеrм

де і P e r f e c t C o r r e l a t i o n T e r m = 2 МеасуrеОfСоrrелатiон=r2ПеrfеcтСоrrелатiонТеrм=2vаr(А)vаr(Б)

Поставте іншими словами, якщо , тоr=cоrrел(А,Б)

σА+Б=σА2+σБ2+2(rσА)(rσБ)

Таким чином, є аналогічним у Законі косинусів. c o sr2cос


2

Я хотів би додати , що то , що ви цитуєте НЕ визначення з , а скоріше наслідок визначень і . Отже, відповідь на те, чому це рівняння має місце, - це обчислення, проведені по биунессу . Ваше питання може бути насправді, чому це має сенс; неофіційно:Vаr(А+Б)VаrСоv

Наскільки буде "змінюватися" залежить від чотирьох факторів:А+Б

  1. Скільки мінялося б самостійно.А
  2. Скільки б самостійно.Б
  3. На скільки буде змінюватися, коли рухається (або змінюється).АБ
  4. Скільки буде змінюватися, коли рухається.БА

Що приводить нас до оскільки - симетричний оператор.= V a r ( A ) + V a r ( B ) + 2 C o v ( A

Vаr(А+Б)=Vаr(А)+Vаr(Б)+Соv(А,Б)+Соv(Б,А)
C o v
=Vаr(А)+Vаr(Б)+2Соv(А,Б)
Соv
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.