(У цій відповіді використовується друге посилання, яке ви дали.)
Згадаймо визначення ймовірності:
де в нашому випадку θ = ( θ A , θ B ) є оцінниками ймовірності того, що монети A і B відповідно наземні голови, X = ( X 1 , … , X 5 ) є результатами наших експериментів, кожен
L[θ|X]=Pr[X|θ]=∑ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,…,X5) що складається з 10 фліп, і
Z = ( Z 1 , ... , Z 5 )
- монета, що використовується в кожному експерименті.
XiZ=(Z1,…,Z5)
Ми хочемо знайти оцінку максимальної правдоподібності & thetas . Алгоритм-Максимізація Expectation (ЕМ) є одним з таких способів , щоб знайти ( по крайней мере , місцевий) & thetas . Він працює, знаходячи умовне очікування, яке потім використовується для максимізації θ . Ідея полягає в тому, що, постійно знаходячи більш імовірні (тобто більш ймовірні) θ
в кожній ітерації, ми будемо постійно збільшувати Pr [ X , Z | θ ], що в свою чергу збільшує ймовірність функції. Є три речі, які потрібно зробити, перш ніж рухатись вперед до проектування алгоритму, заснованого на ЕМ.θ^θ^θθPr[X,Z|θ]
- Побудуйте модель
- Обчислити умовні очікування за моделлю (Е-крок)
- Максимізуйте нашу ймовірність, оновивши нашу поточну оцінку (М-крок)θ
Побудуйте модель
Перш ніж піти далі з ЕМ, нам потрібно розібратися, що саме ми обчислюємо. На етапі Е ми обчислюємо саме очікуване значення для . То яка ж цінність насправді? Зауважте, що
журнал Pr [ X , Z | θ ]logPr[X,Z|θ]
Причина в тому, що у нас є 5 експериментів, і ми не знаємо, яку монету використовували в кожному. Нерівність пояснюється тим, щологє увігнутим і застосовує нерівність Дженсена. Причиною, що нам потрібна нижня межа, є те, що ми не можемо безпосередньо обчислити аргумент max до початкового рівняння. Однак ми можемо обчислити його для остаточної нижньої межі.
logPr[X,Z|θ]=∑i=15log∑C∈{A,B}Pr[Xi,Zi=C|θ]=∑i=15log∑C∈{A,B}Pr[Zi=C|Xi,θ]⋅Pr[Xi,Zi=C|θ]Pr[Zi=C|Xi, θ ]≥ ∑i = 15∑С∈ { A , B }Пр [ Zi= С| Хi, θ ] ⋅ журналПр [ Хi, Zi= С| θ]Пр [ Zi= С| Хi, θ ].
журнал
Тепер що таке ? Ймовірно, що ми бачимо монету C, задану експериментами X i та θ . Використовуючи умовні ймовірності, маємо, Pr [ Z i = C | X i , θ ] = Pr [ X i , Z i = C | θ ]Пр [ Zi= С| Хi, θ ]СХiθ
Пр [ Zi= С| Хi, θ ] = Pr [ Xi, Zi= С| θ]Пр [ Хi| θ].
Поки ми досягли певного прогресу, ми ще не закінчили цю модель. Яка ймовірність того, що дана монета перевернула послідовність ? Нехай h i = # голів у X i Pr [ X i , Z i = C | θ ] = 1Хiгодi= # голів у Xi
ТеперPr[Xi| θ], очевиднотільки ймовірність при обох можливостяхZя=абоZя=B. ОскількиPr[Zi=A]=Pr[
Пр [ Хi, Zi= С| θ]= 12⋅ θгодiС( 1 - θС)10 - годi, для С ∈ { A , B } .
Пр [ Хi| θ]Zi= АZi= В ми маємо,
Pr [ X я | θ ] = 1 / 2 ⋅ ( Pr [ X я | Z я = , θ ] + Pr [ X я | Z я = B , θ ] ) .Пр [ Zi= A ] = Pr [ Zi= В ] = 1 / 2Пр [ Хi| θ]=1 / 2⋅(Pr[ Xi| Zi= A , θ ] + Pr [ Xi| Zi= В , θ ] ) .
Е-крок
θθ0= ( 0,6 , 0,5 )
Пр [ Z1= А | Х1, Θ ] = 1 / 2 ⋅ ( 0.65⋅ 0,45)1 / 2 ⋅ ( ( 0,65⋅ 0,45) + ( 0,55⋅ 0,55) )≈ 0,45.
Х1= ( Н, Т, Т, Т, Н, Н, Т, Н, Т, Н)АE [ # голівки монетою A | Х1, θ ] = h1⋅ Пр [ Z1= А | Х1, θ ] = 5 ⋅ 0,45 ≈ 2.2.
БE [ # голівки монетою B | Х1, θ ] = h1⋅ Пр [ Z1= В | Х1, θ ] = 5 ⋅ 0,55 ≈ 2,8.
год110 - год1Хiгодi 1 ≤ i ≤ 5E [ # голівки монетою A | Х, θ ] = ∑i = 15E [ # голівки монетою A | Хi, θ ]
М-крок
θ
θ1А= Е[ # голови над X монетою А |Х, θ ]Е[ # голови та хвости X монетою А |Х, θ ]= 21,321,3 + 9,6≈ 0,71.
Бθ1θθ^= θ10= ( 0,8 , 0,52 )Пр [ Х, Z| θ]θ
θ^