Пояснення максимізації очікування


11

Я знайшов дуже корисний підручник щодо алгоритму ЕМ .

Приклад та малюнок із підручника просто геніальні.

введіть тут опис зображення

Пов'язане питання щодо обчислення ймовірностей, як працює максимізація очікування?

У мене є ще одне питання щодо того, як з'єднати теорію, описану в підручнику, із прикладом.

Під час Е-кроку ЕМ вибирає функцію яка знижує межі скрізь, і для якої . увійти Р ( х ; & thetas ; ) г т ( Θ ( т ) ) = увійти Р ( х ; Θ ( т ) )гтжурналП(х;Θ)гт(Θ^(т))=журналП(х;Θ^(т))

Отже, що таке у нашому прикладі, і схоже, що воно повинно бути різним для кожної ітерації.гт

Крім того, у прикладі та то застосувавши їх до даних, отримаємо, що і . Що для мене виглядає протилежним інтуїтивно. Ми мали деякі попередні припущення, застосували їх до даних та отримали нові припущення, тому дані так чи інакше змінили припущення. Я не розумію, чому не дорівнює .Θ^А(0)=0,6Θ^Б(0)=0,5Θ^А(1)=0,71Θ^Б(1)=0,58Θ^(0)Θ^(1)

Крім того, виникає більше запитань, коли ви бачите Додаткову примітку 1 до цього підручника. Наприклад, що таке у нашому випадку. Мені не ясно, чому нерівність щільна, колиQ(z)Q(z)=П(z|х;Θ)

Дякую.

Відповіді:


1

Я вважав ці замітки дуже корисними для з'ясування того, що відбувається в додатковому матеріалі.

Я відповім на ці питання трохи не в порядку для наступності.


По-перше: чому це так

θ(0)θ(1)

г0журнал(П(х;θ))θ(0)θ(1)г0θ


Друге: чому нерівність обмежена, коли

Q(z)=П(z|х;θ)

У виносках є натяк на це, де сказано:

у=Е[у]

QП(х,z;θ)Q(z)

П(х,z;θ)=П(z|х;θ)П(х;θ)

що робить нашу фракцію

П(z|х;θ)П(х;θ)П(z|х;θ)=П(х;θ)

П(х;θ)zС

журнал(zQ(z)С)zQ(z)журнал(С)

Q(z)


гт

Відповідь, подана в примітках, які я зв'язав, дещо відрізняється від відповіді в додаткових записках, але вони відрізняються лише постійною, і ми максимізуємо її, щоб вона не мала наслідку. Той, що в примітках (з виведенням):

гт(θ)=журнал(П(х|θ(т)))+zП(z|х;θ(т))журнал(П(х|z;θ)П(z|θ)П(z|х;θ(т))П(х|θ(т)))

Про цю складну формулу в додаткових записках не йдеться дуже довго, можливо, тому що багато цих термінів будуть константами, які викидаються, коли ми максимізуємо. Якщо вас цікавить, як ми приїжджаємо сюди в першу чергу, я рекомендую ті замітки, які я пов’язав.

гт(θ(т))гт(θ(т))=журналП(х|θ(т))

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.