Застосування максимізації очікувань до прикладів кидання монет


18

Останнім часом я самостійно вивчаю максимізацію очікувань і захоплюю собі кілька простих прикладів.

З тут : Є три монети , і з , і відповідну ймовірність для посадки на голові , коли кинув. Кидок . Якщо результат - голова, тричі киньте , інше киньте тричі. Дані, які спостерігаються та є такими: HHH, TTT, HHH, TTT, HHH. Приховані дані є результатом . Оцініть , та .c0c1c2p0p1p2c0c1c2c1c2c0p0p1p2

І звідси : Є дві монети іcAcB з pA і pB що є відповідною ймовірністю посадки на Head при киданні. У кожному раунді виберіть одну монету навмання і киньте її десять разів; записувати результати. Спостережувані дані - це результати жеребкування, надані цими двома монетами. Однак ми не знаємо, яка монета була обрана для конкретного раунду. Розрахунковий pA і pB .

Хоча я можу отримати розрахунки, я не можу пов'язати шляхи їх вирішення з оригінальною теорією ЕМ. Зокрема, під час М-кроку обох прикладів я не бачу, як вони що-небудь максимізують. Просто здається, що вони перераховують параметри і чомусь нові параметри краще, ніж старі. Більше того, два Е-кроки навіть не схожі один на одного, не кажучи вже про Е-крок оригінальної теорії.

То як саме ці приклади працюють?


У першому прикладі, скільки екземплярів одного експерименту ми отримуємо? У другому прикладі, що таке закон "вибрати одну монету навмання"? Скільки раундів ми спостерігаємо?
Рафаель

PDF-файли, які я пов’язав, вже вирішують ці два приклади поетапно. Однак я не дуже розумію використовуваний алгоритм ЕМ.
IcySnow

@IcySnow, ти розумієш поняття очікування та умовного очікування випадкової величини?
Ніколас Манкузо

Я розумію основні очікування випадкової величини та умовної ймовірності. Однак я не знайомий із умовним очікуванням, його похідною та достатньою статистикою.
IcySnow

Відповіді:


12

(У цій відповіді використовується друге посилання, яке ви дали.)

Згадаймо визначення ймовірності: де в нашому випадку θ = ( θ A , θ B ) є оцінниками ймовірності того, що монети A і B відповідно наземні голови, X = ( X 1 , , X 5 ) є результатами наших експериментів, кожен

L[θ|X]=Pr[X|θ]=ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,,X5) що складається з 10 фліп, і Z = ( Z 1 , ... , Z 5 ) - монета, що використовується в кожному експерименті.XiZ=(Z1,,Z5)

Ми хочемо знайти оцінку максимальної правдоподібності & thetas . Алгоритм-Максимізація Expectation (ЕМ) є одним з таких способів , щоб знайти ( по крайней мере , місцевий) & thetas . Він працює, знаходячи умовне очікування, яке потім використовується для максимізації θ . Ідея полягає в тому, що, постійно знаходячи більш імовірні (тобто більш ймовірні) θ в кожній ітерації, ми будемо постійно збільшувати Pr [ X , Z | θ ], що в свою чергу збільшує ймовірність функції. Є три речі, які потрібно зробити, перш ніж рухатись вперед до проектування алгоритму, заснованого на ЕМ.θ^θ^θθPr[X,Z|θ]

  1. Побудуйте модель
  2. Обчислити умовні очікування за моделлю (Е-крок)
  3. Максимізуйте нашу ймовірність, оновивши нашу поточну оцінку (М-крок)θ

Побудуйте модель

Перш ніж піти далі з ЕМ, нам потрібно розібратися, що саме ми обчислюємо. На етапі Е ми обчислюємо саме очікуване значення для . То яка ж цінність насправді? Зауважте, що журнал Pr [ X , Z | θ ]logPr[X,Z|θ] Причина в тому, що у нас є 5 експериментів, і ми не знаємо, яку монету використовували в кожному. Нерівність пояснюється тим, щологє увігнутим і застосовує нерівність Дженсена. Причиною, що нам потрібна нижня межа, є те, що ми не можемо безпосередньо обчислити аргумент max до початкового рівняння. Однак ми можемо обчислити його для остаточної нижньої межі.

журналПр[Х,Z|θ]=i=15журналС{А,Б}Пр[Хi,Zi=С|θ]=i=15журналС{А,Б}Пр[Zi=С|Хi,θ]Пр[Хi,Zi=С|θ]Пр[Zi=С|Хi,θ]i=15С{А,Б}Пр[Zi=С|Хi,θ]журналПр[Хi,Zi=С|θ]Пр[Zi=С|Хi,θ].
журнал

Тепер що таке ? Ймовірно, що ми бачимо монету C, задану експериментами X i та θ . Використовуючи умовні ймовірності, маємо, Pr [ Z i = C | X i , θ ] = Pr [ X i , Z i = C | θ ]Пр[Zi=С|Хi,θ]СХiθ

Пр[Zi=С|Хi,θ]=Пр[Хi,Zi=С|θ]Пр[Хi|θ].

Поки ми досягли певного прогресу, ми ще не закінчили цю модель. Яка ймовірність того, що дана монета перевернула послідовність ? Нехай h i = # голів у  X i Pr [ X i , Z i = C | θ ] = 1Хiгодi=#голови в Хi ТеперPr[Xi| θ], очевиднотільки ймовірність при обох можливостяхZя=абоZя=B. ОскількиPr[Zi=A]=Pr[

Пр[Хi,Zi=С|θ]=12θСгодi(1-θС)10-годi,  для  С{А,Б}.
Пр[Хi|θ]Zi=АZi=Б ми маємо, Pr [ X я | θ ] = 1 / 2 ( Pr [ X я | Z я = , θ ] + Pr [ X я | Z я = B , θ ] ) .Пр[Zi=А]=Пр[Zi=Б]=1/2
Пр[Хi|θ]=1/2(Пр[Хi|Zi=А,θ]+Пр[Хi|Zi=Б,θ]).

Е-крок

θθ0=(0,6,0,5)

Пр[Z1=А|Х1,θ]=1/2(0,650,45)1/2((0,650,45)+(0,550,55))0,45.
Х1=(Н,Т,Т,Т,Н,Н,Т,Н,Т,Н)А
Е[#голови монетою А|Х1,θ]=год1Пр[Z1=А|Х1,θ]=50,452.2.
Б
Е[#голови монетою Б|Х1,θ]=год1Пр[Z1=Б|Х1,θ]=50,552.8.
год110-год1Хiгодi 1i5
Е[#голови монетою А|Х,θ]=i=15Е[#голови монетою А|Хi,θ]

М-крок

θ

θА1=Е[#голови над Х монетою А|Х,θ]Е[#голови та хвости Х монетою А|Х,θ]=21.321.3+9.60,71.
Бθ1θθ^=θ10=(0,8,0,52)Пр[Х,Z|θ]θ

θ^


Якщо якісь деталі не зрозумілі, я також можу спробувати розширити їх.
Ніколас Манкузо

Зараз стає набагато зрозуміліше. Що я насправді не отримую, тому очікувана кількість головок для монети A обчислюється як: E [#головок монети A | X1, θ] = h1⋅Pr [Z1 = A | X1, θ] = 5⋅0.45 ≈2,2? Проблема, згадана в першому PDF, є більш складною. Якщо ви не заперечуєте, чи можете ви також зробити кілька ілюстративних розрахунків? Велике спасибі за вашу відповідь.
IcySnow

Е[# голови монетою А|Х1,θ]=# голови в Х1Пр[Z1=А|Х1,θ]=5Пр[Z1=А|Х1,θ]. Причина полягає в тому, що ви можете подумати про те, що була використана інша випадкова величина індикатора, якщо використовується A Обчислення розрахунку над змінними індикатора є простою ймовірністю цієї події.
Ніколас Манкузо

Вибачте за повільну відповідь. Завдяки вам я тепер можу реально зрозуміти логіку двох прикладів монет, переглянувши вашу відповідь багато разів. Останнє, що я хочу запитати стосовно цього питання: Приклад, що починається зі сторінки 8 цього слайда cs.northwestern.edu/~ddowney/courses/395_Winter2010/em.ppt, показує, що в M-Step нам потрібно спочатку обчислити похідна функції лого-правдоподібності і використовувати її для максимального очікування. Чому чогось подібного у монетах не підкидається «М-кроки»? Оскільки ці кроки M не схожі на те, що вони максимально збільшують
IcySnow

Пр[Zi=А|Хi,θ]+Пр[Zi=Б|Хi,θ]=1i
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.