Інтуїція для умовного очікування


20

Нехай - простір ймовірностей, заданий випадковою змінною і -algebra ми можемо побудувати нову випадкову змінну , що є умовним очікуванням.( Ω , F , μ ) ξ : Ω R σ GF E [ ξ | G ](Ω,F,μ)ξ:ΩRσGFE[ξ|G]


Яка саме інтуїція думати про ? Я розумію інтуїцію щодо наступного:E [ ξ | G ]E[ξ|G]

(i) де - подія (з позитивною ймовірністю).E [ ξ | А ] АE[ξ|A]A

(ii) де - дискретна випадкова величина.E [ ξ | η ] ηE[ξ|η]η

Але я не можу уявити . Я розумію математику, і я розумію, що вона визначена таким чином, щоб узагальнити простіші випадки, які ми можемо уявити. Але тим не менше я не вважаю такий спосіб мислення корисним. Він залишається для мене загадковим об’єктом.E [ ξ | G ]E[ξ|G]


Наприклад, нехай - подія з . Формують -алгебри , один породжений . Тоді було б дорівнює якщо , і дорівнює , якщо . Іншими словами, якщо , і якщо .A μ ( A ) > 0 σ G = { , A , A c , Ω } A E [ ξ | G ] ( ω ) 1Aμ(A)>0σG={,A,Ac,Ω}AE[ξ|G](ω)μ ( A )AξωA11μ(A)AξωAμ ( A c )AcξωAE[ξ| G](ω)=E[ξ| A]ωAE[ξ| G](ω)=E[ξ| Ac]ωAc1μ(Ac)AcξωAE[ξ|G](ω)=E[ξ|A]ωAE[ξ|G](ω)=E[ξ|Ac]ωAc

Частина, яка заплутує, полягає в тому, що , то чому ми не просто пишемо ? Чому ми замінюємо на залежно від того, чи ні , але не дозволено замінювати на ?ω Ω E [ ξ | G ] ( ω ) = E [ ξ | Ω ] = E [ ξ ] E [ ξ | G ] E [ ξ | A  або  A c ] ω A E [ ξ | G ]ωΩE[ξ|G](ω)=E[ξ|Ω]=E[ξ]E[ξ|G]E[ξ|A or Ac]ω AЕ[ ξ| Г]E [ ξ ]Е[ ξ]


Примітка. Відповідаючи на це питання, не пояснюйте це, використовуючи суворе визначення умовного очікування. Я розумію, що. Що я хочу зрозуміти, це те, що умовне очікування повинно бути обчислене і чому ми відкидаємо одне замість іншого.

Відповіді:


16

Один із способів думати про умовне подання - це проекція на -algebra .σ GσГ

введіть тут опис зображення( від Вікісховища )

Це насправді суворо вірно, якщо говорити про випадкові змінні, що інтегруються в квадрат; у цьому випадку E [ ξ | G ] насправді ортогональна проекція випадкової величини £ , на підпростір L 2 ( Ом ) , що складається з випадкових величин , вимірюваних щодо G . Насправді це навіть виявляється правдою в деякому сенсі для L 1 випадкових змінних через наближення до L 2 випадкових змінних.E [ξ| Г]ξL2( Ω )ГL1L2

(Див. Коментарі для довідок.)

Якщо розглянути σ - алгебри як такі, що представляють багато інформації, яку ми маємо (інтерпретація, яка є de rigueur в теорії стохастичних процесів), то більші σ - алгебри означають більше можливих подій і, таким чином, більше інформації про можливі результати, тоді як менші σ - алгебри означають менше можливих подій і, таким чином, менше інформації про можливі результати.σ-σ-σ-

Тому, проектуючи F вимірного випадкової величини £ , на менший сг - алгебра G означає приймати наше краще припущення для значення £ , враховуючи більш обмежену інформацію , доступну з G .Жξσ-ГξГ

Іншими словами, дається лише інформація з G , а не вся інформація з F , E [ ξ | G ] в суворому сенсі - найкраща здогадка про те, що таке випадкова величина ξ .ГЖE [ξ| Г]ξ


Що стосується вашого прикладу, я думаю, що ви можете заплутати випадкові величини та їх значення. Випадкова величина X - це функція , домен якої - простір подій; це не число. Іншими словами, X : Ω R , X { f | F : Ом R } , тоді як для зі П , X ( ω ) R .ХХ: Ω R  Х{f | f:ΩR}ωΩX(ω)R

Позначення умовного очікування, на мою думку, насправді погано, оскільки це сама випадкова величина, тобто також функція . Навпаки, (регулярне) очікування випадкової величини - це число . Умовне очікування випадкової величини - це зовсім інша величина від очікування тієї ж випадкової величини, тобто E [ ξ | G ] навіть не "перевіряє тип" з E [ ξ ] .E[ξ|G]E[ξ]

Іншими словами, використання символу Е для позначення як звичайних, так і умовних очікувань є дуже великим зловживанням позначенням, що призводить до багато непотрібної плутанини.E

Враховуючи це, зауважте, що E [ ξ | G ] ( ω ) - це число (значення випадкової величини E [ ξ | G ], оцінене за значенням ω ), але E [ ξ | Ω ] - випадкова величина, але вона виявляється постійною випадковою змінною (тобто тривіально виродженою), оскільки σ -алгебра, породжена Ω , { , Ω }E[ξ|G](ω)E[ξ|G]ωE[ξ|Ω]σΩ{,Ω}є тривіальним / виродженим, а технічно кажучи постійним значенням цієї постійної випадкової величини, є E [ ξ ] , де тут E позначає регулярне очікування і, отже, число, а не умовне очікування і, таким чином, не випадкова величина.E[ξ]E

Крім того, вам здається, що ви заплуталися в тому, що позначення E [ ξ | A ] означає; технічно кажучи, умову можна задати лише на σ - алгебри, а не на окремі події, оскільки ймовірнісні заходи визначаються лише на повних σ - алгебрах, а не на окремих подіях. Таким чином, E [ ξ | A ] - просто (ледача) скорочення для E [ ξ | σ ( A ) ] , де σ ( A ) означає σ -E[ξ|A]σσE[ξ|A]E[ξ|σ(A)]σ(A)σалгебра, породжена подією A , яка дорівнює { , A , A c , Ω } . Зауважимо, що σ ( A ) = G = σ ( A c ) ; іншими словами, E [ ξ | A ] , E [ ξ | G ] , і E [ ξ | A c ] - всі різні способи позначення саме того самого об'єкта .A{ , A , Ac, Ω }σ(A)=G=σ(Ac)E[ξ|A]E[ξ|G]E[ξ|Ac]

Насамкінець просто хочу додати, що інтуїтивне пояснення, яке я дав вище, пояснює, чому постійне значення випадкової величини E [ ξ | Ω ] = E [ ξ | σ ( Ω ) ] = E [ ξ | { , Ω } ] тільки число E [ ξ ] - σ - алгебра { , Ω }E[ξ|Ω]=E[ξ|σ(Ω)]=E[ξ|{,Ω}]E[ξ]σ{,Ω}являє собою найменший можливий обсяг інформації, який ми могли б мати, фактично не має жодної інформації, тому за цієї крайньої обставини найкращою здогадкою, яку ми могли б мати, для якої випадкової величини ξ є постійна випадкова величина, постійне значення якої E [ ξ ] .ξE [ξ]

Зверніть увагу , що всі постійні випадкові величини L 2 випадкові величини, і всі вони вимірні щодо тривіального сг - алгебри { , Ом } , так що на насправді ми маємо , що константа випадкових Е [ ξ ] є ортогональною проекцією £ , на підпростір L 2 ( Ω ), що складається з випадкових величин, що вимірюються відносно { , Ω } , як було заявлено.L2σ{ , Ω }E [ξ]ξL2( Ω ){ , Ω }


2
@William Я не згоден з вами щодо використання E [ ξ | А ] як побіг вар. Багато книг визначають E [ ξ | A ] бути числом, а не запущеним var. Це найкраща можлива оцінка ξ | . Це корисне поняття і дуже інтуїтивно зрозуміле. Повністю його ігноруючи лише тому, що у вас є узагальнене поняття cond exp як ran var, неправильно з педагогічної точки зору. Мене не бентежить, що таке rv, і не бачу, як щось, що я написав, призвело б вас до такого думки. Е[ ξ| A]Е[ ξ| A]ξ|А
Ніколя Бурбакі

1
@William Думаючи cond expe як оцінку для запущеного вару з G, що представляє інформацію, - це те, що я бачив раніше, але я ніколи не задумувався над цим і намагався знайти інший спосіб візуалізації очікуваного стану. Використовуючи вашу пропозицію, я збираюся написати простий приклад і розмістити його як відповідь, як для себе, так і для інших людей. Можливо, деякі люди можуть потім детальніше пояснити мій приклад і дати більш екзотичний. Г
Ніколя Бурбакі

1
@NicolasBourbaki Рекомендую подивитися на с.221 4-го видання « Вірогідність Дерретта - теорія та приклади» . Я можу віднести вас до інших джерел, що обговорюють це. У будь-якому випадку, це насправді не питання думки - в найзагальнішому випадку умовне очікування є випадковою змінною, а обумовлення робиться лише стосовно σ - алгебр; кондиціонування відносно події - це кондиціонування щодо σ - алгебри, породженої подією, а кондиціонування відносно випадкової величини - це кондиціонування wrt σ -алгебри, породженої RVσ-σ-σ
Chill2Macht

3
@William І я можу посилатись на джерела, які визначають умову. exep реального числа події. Я не знаю, чому ви так застрягли в цьому питанні. Визначити це можна будь-яким способом, доки поняття не будуть змішані. З педагогічних міркувань викладання класу на проб. теорія, і миттєво стрибнувши в найзагальніший деф, не висвітлює. У будь-якому випадку це дійсно не має значення в цій дискусії, і ваша скарга стосується нотації / семантики.
Ніколя Бурбакі

1
@NicolasBourbaki Глава 5 Вірогідності Віттла через очікування дає дуже хороший виклад (на мій погляд) обох характеристик умовного очікування, і добре пояснює, як кожне визначення стосується і мотивоване іншим визначенням. Ви праві, що відмінність - це ще одна семантика. Моє захоплення більш загальним визначенням походить (я думаю) з прочитання цієї глави (5 Вірогідності Віттла через очікування ), яка зробила (я вважаю) хороші аргументи про те, як більш загальне визначення якимось чином легше зрозуміти.
Chill2Macht

3

Я спробую розробити те, що запропонував Вільям.

Нехай Ω - пробний простір кидання монети вдвічі. Визначте пробіг. вар. ξ - число. голів, які трапляються в експерименті. Ясно, що E [ ξ ] = 1 . Один із способів мислення того, що 1 , як очікування. значення, являє собою як найкращу оцінку для ξ . Якби нам довелося здогадуватися про те, яке значення буде брати ξ , ми б здогадалися 1 . Це тому, що E [ ( ξ - 1 ) 2 ] E [ ( ξ - a ) 2ΩξЕ[ ξ] = 11ξξ1] для будь-якого реального числа a .Е[ ( ξ- 1 )2] E[ ( ξ- а )2]а

Позначимо через A = { H T , H H } як випадок, коли перший результат - голова. Нехай G = { , A , A c , Ω } - σ -alg. род. на A . Ми вважаємо, що G представляє те, що ми знаємо після першого кидання. Після першого жеребкування не виникало ні головок, ні голів. Отже, ми знаходимося або у випадку A, або A c після першого жеребкування.A = { HТ, НН}Г= { , A , Ac, Ω }σАГААc

Якщо ми знаходимось у випадку A , то найкращою можливою оцінкою для ξ буде E [ ξ | A ] = 1,5 , і якщо ми знаходимось у випадку A c , то найкращою оцінкою для ξ було б E [ ξ | A c ] = 0,5 .АξЕ[ ξ| A]=1,5АcξЕ[ ξ| Аc] = 0,5

Тепер визначимо пробіг. вар. η ( ш ) , щоб бути або 1,5 або 0,5 в залежності від наявності або відсутності ш . Цей біг. вар. η , є кращим наближенням, ніж 1 = E [ ξ ], оскільки E [ ( ξ - η ) 2 ] E [ ( ξ - 1 ) 2 ] .η(ω)1.50.5ωAη1=E[ξ]E[(ξη)2]E[(ξ1)2]

Що η робить, це дає відповідь на питання: яка найкраща оцінка ξ після першого жеребкування? Так як ми не знаємо , інформацію після першого кидку, η буде залежати від А . Як тільки нам відкривається подія G , після першого жеребкування визначається значення η і забезпечує найкращу можливу оцінку для ξ . ηξηAGηξ

Проблема з використанням ξ як власної оцінки, тобто 0 = E [ ( ξ - ξ ) 2 ] E [ ( ξ - η ) 2 ] полягає в наступному. ξ недостатньо чітко визначений після першого жеребкування. Скажімо, результат експерименту - це ω, перший результат - голова, ми знаходимось у випадку А , але що таке ξ ( ω ) = ? Ми не знаємо лише з першого жеребкування, що це значення для нас неоднозначне, і так ξξ0=E[(ξξ)2]E[(ξη)2]ξωAξ(ω)=?ξнедостатньо чітко визначений. Більш формально ми говоримо, що ξ не є G- вимірюваним, тобто його значення не є чітко визначеним після першого кидання. Таким чином, η - найкраща оцінка ξ після першого жеребкування.ξGηξ

Можливо, хтось тут може придумати більш складний приклад, використовуючи пробний простір [ 0 , 1 ] , причому ξ ( ω ) = ω , G - деяка нетривіальна σ -алгебра.[0,1]ξ(ω)=ωGσ


1

Хоча ви просите не використовувати формальне визначення, я вважаю, що формальне визначення, мабуть, є найкращим способом його пояснення.

Вікіпедія - умовне очікування :

Тоді умовне очікування X, заданого Н , позначене як E ( X H ) - це будь-яка Н- вимірювана функція ( Ω R n ), яка задовольняє:HE(XH)HΩRn

H E(X H )d P = H Xd Pдля кожногоH HHE(XH)dP=HXdPfor eachHH

По-перше, це Н- мірна функція. По- друге, повинен відповідати очікуванням по кожній вимірної (суб) безлічі в H . Отже, для події A алгебра сигми дорівнює { A , A C , , Ω } , тому чітко вона встановлюється так, як ви вказали у своєму запитанні для ω A / A c . Аналогічно для будь-якої дискретної випадкової змінної (та їх комбінацій) ми перераховуємо всі примітивні події та присвоюємо очікування, враховуючи цю примітивну подію.HH{A,AC,,Ω}ωA/Ac

Тепер розглянемо підкидання монети нескінченне число разів, де на кожному кидку я, ви отримаєте +1 / +2 я , якщо ваша монета хвостами , то ваш загальний виграш X = Е я = 1 11/2i2 i ciдеci= 1 для хвостів і 0 для голів. Тоді X - реальна випадкова величина на[0,1]. Після п кидків монети, ви знаєтезначення X в точності1/2п, наприкладпісля2 монети підкидає вона знаходиться в [0,1 / 4], [1 / 4,1 / 2], [1 / 2,3 / 4] або [3 / 4,1] - після кожного кидання монети ваша асоційована алгебра сигми стає все тонкішою і тонкішою, і аналогічно умовне очікування X стає все більш точним.X=i=112icici[0,1]1/2n

Сподіваємось, цей приклад реальної цінної випадкової величини з послідовністю сигма-алгебр, що стає все тонкішою та тоншою (Фільтрація), відволікає вас від інтуїції, з якою ви звикли до подій, до якої ви звикли, та уточнює її призначення.


Прошу вибачення, але я спротив це питання. Це не відповідає тому, що я спочатку запитав. Він також не надає нової інформації, про яку я раніше не знав.
Ніколя Бурбакі

Те, що я намагаюся вам запропонувати, - це ви не розумієте формальне визначення так добре, як ви думаєте, що ви робите (як це запропонувала й інша відповідь), тому, якщо ви не працюєте через те, що не є інтуїтивно зрозумілим, формальне визначення ви не будете прогресувати.
seanv507

Я розумію формальне визначення просто чудово. На запитання, які я задавав, я знаю, як відповісти на них, працюючи з формальних визначень. "Інша відповідь", намагалася пояснити моє запитання, не використовуючи визначення кон. досвід
Ніколя Бурбакі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.