Я припускаю, що вам подобається розглядати прямокутний трикутник як такий, що E[Y∣X] і Y−E[Y∣X] є некорельованими випадковими змінними. Для некорельованих випадкових величин A і B ,
var(A+B)=var(A)+var(B),(1)
і так, якщо ми встановимо
A=Y−E[Y∣X] і
B=E[Y∣X] так що
A+B=Y , отримаємо, що
var(Y)=var(Y−E[Y∣X])+var(E[Y∣X]).(2)
Залишилося показати, що
- це те саме, що
E [ var ( Y ∣ X ) ], так що ми можемо повторно вказати
( 2 ) як
var ( Y ) = E [ var ( Y ∣ X ) ] + var ( E [ Y ∣ X ] )
яка є загальною дисперсійною формулою.
var(Y−E[Y∣X])E[var(Y∣X)](2)var(Y)=E[var(Y∣X)]+var(E[Y∣X])(3)
Загальновідомо, що очікуване значення випадкової величини є E [ Y ] , тобто E [ E [ Y ∣ X ] ] = E [ Y ] . Отже, ми бачимо, що
E [ A ] = E [ Y - E [ Y ∣ X ] ] = E [ Y ] - E [ E [E[Y∣X]E[Y]E[E[Y∣X]]=E[Y]
звідси випливає, що var ( A ) = E [ A 2 ] , тобто
var ( Y - E [ Y ∣ X ] ) = E [ ( Y - E [ Y ∣ X ] ) 2 ] .
Нехай C позначає випадкову змінну ( Y - E [ Y
Е[ A ] = E[ Y- Е[ Y∣ X] ] = Е[ Y] - Е[ Є[ Y∣ X] ] = 0 ,
вар( А ) = Е[ А2]вар( Y- Е[ Y∣ X] ) = Е[ ( Y- Е[ Y∣ X] )2] .(4)
С щоб ми могли записати, що
var ( Y - E [ Y ∣ X ] ) = E [ C ] .
Але,
E [ C ] = E [ E [ C ∣ X ] ], де
E [ C ∣ X ] = E [ ( Y - E [ Y ∣ X ] )( Y- Е[ Y∣ X] )2вар( Y- Е[ Y∣ X] ) = Е[ С] .(5)
Е[ С] = Е[ Є[ С∣ X] ]
Тепер,
враховуючи,що
X = x , умовний розподіл
Y має середнє
E [ Y ∣ X = x ]
і так
E [ ( Y - E [ Y ∣ X = x ] ) 2 | X = x ] = var ( Y ∣ X = x ) .
Іншими словами,
EЕ[ С∣ X] = Е[ ( Y- Е[ Y∣ X] )2∣∣Х] .Х= хYЕ[ Y∣ X= х ]Е[ ( Y- Е[ Y∣ X= х ] )2∣∣Х= х ] = вар( Y∣ X= х ) .
так що
випадкова величина E [ C ∣ X ] є просто
var ( Y ∣ X ) . Отже,
E [ C ] = E [ E [ C ∣ X ] ] = E [ var ( Y ∣ X ) ] ,Е[ С∣ X= х ] = вар( Y∣ X= х ) Е[ С∣ X]вар( Y∣ X)Е[ С] = Е[ Є[ С∣ X] ] = Е[ вар( Y∣ X) ] ,(6)
що при заміні на
показує, що
var ( Y - E [ Y ∣ X ] ) = E [ var ( Y ∣ X ) ] .
Це робить праву частину
( 2 ) саме того, що нам потрібно, і тому ми довели формулу загальної дисперсії
( 3 ) .
( 5 )вар( Y- Е[ Y∣ X] ) = Е[ вар( Y∣ X) ] .
( 2 )( 3 )