Узагальнення Закону ітераційних очікувань


43

Нещодавно я натрапив на цю особу:

E[E(Y|X,Z)|X]=E[Y|X]

Я, звичайно, знайомий з більш простою версією цього правила, а саме з тим, що E[E(Y|X)]=E(Y) але я не зміг знайти виправдання для його узагальнення.

Я був би вдячний, якби хтось міг вказати мені на не дуже технічну довідку щодо цього факту, а ще краще, якщо хтось міг би викласти простий доказ цього важливого результату.


2
Якби y сам був обумовлений деяким x то чи не випадало б це саме з простої версії?
Мехрдад

Відповіді:


36

ІНФОРМАЦІЙНЕ ЛІКУВАННЯ

Ми повинні пам’ятати, що позначення, де ми обумовлені випадковими змінними, є неточними, хоча й економічними, як позначення. Насправді ми обумовлюємо сигма-алгебру, яку генерують ці випадкові величини. Іншими словами, E[YX] означає E[Yσ(X)] . Це зауваження може здатися неприйнятним у "Неофіційному лікуванні", але воно нагадує нам, що наші кондиціонуючі сукупності є колекціями наборів (а коли ми обумовлюємо одне значення, то це однократний набір). А що містять ці набори? Вони містять інформаціюз яким можливими значеннями випадкової величини X поставляють нам про те, що може статися з реалізацією Y .
Внесення поняття Інформація дозволяє нам подумати про (і використовувати) Закон Ітераційних Очікувань (іноді його називають "Властивістю вежі") дуже інтуїтивно зрозумілим чином:
сигма-алгебра, породжена двома випадковими змінними, принаймні як великий, як той, що генерується однією випадковою змінною: σ(X)σ(X,Z) у відповідному множинно-теоретичному значенні. Отже, інформація про Y міститься в σ(X,Z) принаймні настільки ж велика, як відповідна інформація уσ(X) .
Тепер, як умовне натяк, встановітьσ(X)Ix іσ(X,Z)Ixz . Тоді LHS рівняння, яке ми дивимось, можна записати

Описуючи усно наведене вище вираз ми маємо: «що таке очікування {очікуване значення Y з урахуванням даних I х г }враховуючищо ми маємо наявну інформацію я х тільки

E[E(Y|Ixz)|Ix]
YIxzIx

Чи можемо ми якось «врахувати» ? Ні - ми знаємо лише I x . Але якщо ми використовуємо те, що маємо (як ми зобов'язані виразом, який ми хочемо розв'язати), то ми по суті говоримо речі про Y під оператором очікувань, тобто ми говоримо " E ( Y I x ) ", не більше - ми щойно вичерпали нашу інформацію.IxzIxYE(YIx)

Звідси

E[E(Y|Ixz)|Ix]=E(Y|Ix)

Якщо хтось іншого не зробить, я повернусь для офіційного лікування.

(Трохи більше) ФОРМАЛЬНЕ ЛІКУВАННЯ

Давайте подивимось, як дві дуже важливі книги теорії ймовірностей, "Вірогідність і міра П. Біллінгслі" (3-е видання-1995) та Д. Вільямса "Імовірність з Мартингейлами" (1991), трактують питання доведення "Закону ітерованих очікувань":
Біллінгслі присвячує доведення рівно трьох рядків. Вільямс, і я цитую, каже

"(властивість вежі) практично не відповідає визначенню умовного очікування".

Це один рядок тексту. Доказ Біллінглі не менш непрозорий.

Вони, звичайно, праві: це важливе і дуже інтуїтивне властивість умовного очікування походить по суті безпосередньо (і майже негайно) з його визначення - єдиною проблемою є, я підозрюю, що це визначення зазвичай не викладається або, принаймні, не підкреслюється, поза вірогідністю або виміряти теоретичні кола. Але для того, щоб показати у (майже) трьох рядках, що існує Закон повторених очікувань, нам потрібно визначення умовного очікування, а точніше його визначальної властивості .

Нехай імовірнісний простір , і інтегрована випадкова величина Y . Нехай G є суб σ - алгебра F , GF . Тоді існує функція W, яка G - вимірювана, інтегрується і (це визначальна властивість)(Ω,F,P)YGσFGFWG

E(W1G)=E(Y1G)GG[1]

де індикаторна функція безлічі G . Ми говоримо, що W є ("версія") умовного очікування Y, заданого G , і пишемо W = E ( Y G )1GGWYG Критичне деталь відзначити, що умовне математичне сподівання, має таке ж значенняяк очікується , Y робить,не тільки по всій G ,але в кожному підмножині G з G .W=E(YG)a.s.
YGGG

(Я зараз спробую представити, як властивість Tower випливає з визначення умовного очікування).

- G- міряна випадкова величина. Розглянемо тепер деякі суб σ - алгебра, скажімо HG . Тоді G HG G . Отже, аналогічно, як і раніше, маємо умовне очікування W, заданого H , скажімо, U = E ( W H )WGσHGGHGGWHщо характеризується U=E(WH)a.s.

E(U1G)=E(W1G)GH[2]

Оскільки , рівняння [ 1 ] і [ 2 ] дають намHG[1][2]

E(U1G)=E(Y1G)GH[3]

Але це визначальне властивість умовного очікування даного H . YHОтже, ми маємо право писати Оскільки ми також побудували U = E ( W H ) = E ( E [ Y G ] H ) , ми лише довели властивість Вежі, або загальну форму Закону відмінених очікувань - у вісім рядків.U=E(YH)a.s.
U=E(WH)=E(E[YG]H)


6
Yσ(X,Z)σ(X)

Дякую вам обом, куб.см @whuber. Це дуже корисна теорема.
JohnK

@ whuber Дякуємо, що помітили це - та за пропозицію.
Алекос Пападопулос

24

Те, як я розумію умовне очікування та навчаю своїх учнів, полягає в наступному:

E[Y|σ(X)]σ(X)

E[Y|σ(X)]E[Y|X]YE[Y|σ(X,Z)]σ(X,Z). Очікування - оператор усереднення (оператор «розмивання»?). Екран може містити багато предметів, але зображення, зроблене вами за допомогою камери з низькою роздільною здатністю, неодмінно знищить деталі, наприклад, на небі може бути НЛО, який можна побачити неозброєним оком, але це не так з'являються у вашій фотографії, зробленій (iphone 3?)

σ(X,Z)=σ(Y)E[Y|σ(Y)]=Y

E[E[Y|σ(X,Z)]|σ(X)]σ(X)σ(X,Z)σ(X,Z)σ(X)

E[E[Y|X,Z]|X]=E[Y|X]E[E[Y|X]|X,Z]=E[Y|X]ще. Це тому, що: якщо ваше перше фото зроблене iphone 1 (тобто низькою роздільною здатністю), а тепер ви хочете використовувати кращу камеру (наприклад, iphone 3) для створення ще однієї фотографії на першій фотографії, тоді ви не можете може покращити якість першої фотографії.


2
любити це! :) чудове пояснення.
jessica

1
@jessica Я радий, що це допомагає :-) Знадобилось час, щоб придумати це пояснення
KevinKim

21

E[E[YX]]=E[Y]Xg(X)YXYYYXYpX,Y(x,y)

E[Y]=yypY(y)definition=yyxpX,Y(x,y)write in terms of joint pmf=yyxpYX(yX=x)pX(x)write in terms of conditional pmf=xpX(x)yypYX(yX=x)interchange order of summation=xpX(x)E[YX=x]inner sum is conditional expectation=E[E[YX]]RV E[YX] has value E[YX=x] when X=x
XE[YX]XYY

E[E[YX,Z]X]h(X,Z)XZ E[YX]E[YX]Xx

E[YX=x]=yypYX(yX=x)=yypX,Y(x,y)pX(x)=yyzpX,Y,Z(x,y,z)pX(x)=yyzpYX,Z(yX=x,Z=z)pX,Z(x,z)pX(x)=zpX,Z(x,z)pX(x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)E[YX=x,Z=z)=E[E[YX,Z]X=x]
E[YX,Z]XZXXxE[YX,Z]ZX

xXE[YX]XYE[E[YX,Z]X]

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.