Закон сумарної дисперсії як теорема Піфагора


15

Припустимо, що і мають кінцевий другий момент. У просторі Гільберта випадкові величини з другим кінцевим моментом (із внутрішнім творомXYT1,T2 визначеним E(T1T2) , ||T||2=E(T2) ), ми можемо інтерпретувати E(Y|X) як проекція Y на простір функцій X .

Відомо також, що Закон сумарної варіації читає

Var(Y)=E(Var(Y|X))+Var(E(Y|X))

Чи є спосіб інтерпретувати цей закон з точки зору геометричної картини вище? Мені сказали, що закон є таким самим, як теорема Піфагора для прямокутного трикутника зі сторонами Y,E(Y|X),YE(Y|X) . Я розумію, чому трикутник прямокутний, але не те, як теорема Піфагора захоплює Закон сумарної варіації.

Відповіді:


7

Я припускаю, що вам подобається розглядати прямокутний трикутник як такий, що E[YX] і YE[YX] є некорельованими випадковими змінними. Для некорельованих випадкових величин A і B ,

(1)var(A+B)=var(A)+var(B),
і так, якщо ми встановимо A=YE[YX] іB=E[YX] так щоA+B=Y , отримаємо, що
(2)var(Y)=var(YE[YX])+var(E[YX]).
Залишилося показати, що - це те саме, що E [ var ( Y X ) ], так що ми можемо повторно вказати ( 2 ) як var ( Y ) = E [ var ( Y X ) ] + var ( E [ Y X ] ) яка є загальною дисперсійною формулою.var(YE[YX])E[var(YX)](2)
(3)var(Y)=E[var(YX)]+var(E[YX])

Загальновідомо, що очікуване значення випадкової величини є E [ Y ] , тобто E [ E [ Y X ] ] = E [ Y ] . Отже, ми бачимо, що E [ A ] = E [ Y - E [ Y X ] ] = E [ Y ] - E [ E [E[YX]E[Y]E[E[YX]]=E[Y] звідси випливає, що var ( A ) = E [ A 2 ] , тобто var ( Y - E [ Y X ] ) = E [ ( Y - E [ Y X ] ) 2 ] . Нехай C позначає випадкову змінну ( Y - E [ Y

Е[А]=Е[Y-Е[YХ]]=Е[Y]-Е[Е[YХ]]=0,
вар(А)=Е[А2]
(4)вар(Y-Е[YХ])=Е[(Y-Е[YХ])2].
С щоб ми могли записати, що var ( Y - E [ Y X ] ) = E [ C ] . Але, E [ C ] = E [ E [ C X ] ], де E [ C X ] = E [ ( Y - E [ Y X ] )(Y-Е[YХ])2
(5)вар(Y-Е[YХ])=Е[С].
Е[С]=Е[Е[СХ]] Тепер,враховуючи,що X = x , умовний розподіл Y має середнє E [ Y X = x ] і так E [ ( Y - E [ Y X = x ] ) 2 | X = x ] = var ( Y X = x ) . Іншими словами, EЕ[СХ]=Е[(Y-Е[YХ])2|Х].Х=хYЕ[YХ=х]
Е[(Y-Е[YХ=х])2|Х=х]=вар(YХ=х).
так щовипадкова величина E [ C X ] є просто var ( Y X ) . Отже, E [ C ] = E [ E [ C X ] ] = E [ var ( Y X ) ] ,Е[СХ=х]=вар(YХ=х) Е[СХ]вар(YХ)
(6)Е[С]=Е[Е[СХ]]=Е[вар(YХ)],
що при заміні на показує, що var ( Y - E [ Y X ] ) = E [ var ( Y X ) ] . Це робить праву частину ( 2 ) саме того, що нам потрібно, і тому ми довели формулу загальної дисперсії ( 3 ) .(5)
вар(Y-Е[YХ])=Е[вар(YХ)].
(2)(3)

Y-Е(Y|Х)vаr(Y-Е(Y|Х))=Е[Y-Е(Y|Х)]2Еvаr(Y|Х)=Е[Е((Y-Е(Y|Х))2|Х)]=Е[Y-Е(Y|Х)]2

1
Е[(Y-Е[Y|Х])2]

1
Діліп, багато вірогідників правильно трактували б рівняння @ mpiktas як написане; зайвий набір дужок часто скидається. Можливо, мої очі мене обманюють, але я вважаю, що його позначення цілком узгоджуються. Я радий допомогти виправити речі, якщо бажаєте. :-)
кардинал

ЕХЕХХЕХ2

vаr

2

Заява:

Т1Т2Т1,Т2=0,

(1)||Т1+Т2||2=||Т1||2+||Т2||2.
Або іншими словами, для ортогональних векторів довжина квадрата суми - це сума довжин квадрата.

Наш випадок:

У нашому випадку Т1=Е(Y|Х) і Т2=Y-Е[Y|Х] є випадковими змінними, норма квадрата є ||Тi||2=Е[Тi2] і внутрішній продукт Т1,Т2=Е[Т1Т2]. Переклад (1) на статистичну мову дає нам:

(2)Е[Y2]=Е[{Е(Y|Х)}2]+Е[(Y-Е[Y|Х])2],
оскільки Е[Т1Т2]=Ков(Т1,Т2)=0. Якщо ми змінимося, ми можемо зробити це схожим на ваш заявлений Закон про повну варіацію(2) від ...
  1. Відняти (Е[Y])2 з обох боків, роблячи ліву сторону Вар[Y],

  2. Помітивши з правого боку це Е[{Е(Y|Х)}2]-(Е[Y])2=Вар(Е[Y|Х]),

  3. Зауваживши це Е[(Y-Е[Y|Х])2]=Е[Е{(Y-Е[Y|Х])2}|Х]=Е[Вар(Y|Х)].

Детальніше про ці три кулі точки див. У публікації @ DilipSarwate. Він пояснює це все набагато детальніше, ніж я.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.