Алгоритм ЕМ Практична задача


9

Це проблема практики для середньострокового іспиту. Проблема - приклад алгоритму ЕМ. У мене виникають проблеми з частиною (f). Я перераховую частини (а) - (д) для завершення, і якщо я помилився раніше.

Нехай - незалежні експоненціальні випадкові величини зі швидкістю . На жаль, фактичні значення не спостерігаються, і ми лише спостерігаємо, чи знаходяться значення в певні інтервали. Нехай , і для . Дані, що спостерігаються, складаються з .X1,,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2}G3j=1{Xj>2}j=1,,n(G1j,G2j,G3j)

(a) Наведіть імовірність спостережуваних даних:

L(θ|G)=j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=j=1n(1eθ)G1j(eθe2θ)G2j(e2θ)G3j

(b) Надайте повну вірогідність даних

L(θ|X,G)=j=1n(θeθxj)G1j(θeθxj)G2j(θeθxj)G3j

(c) Отримати прогнозну щільність прихованої змінноїf(xj|G,θ)

f(xj|G,θ)=fX,G(xj,g)fG(g)=θeθxj1{xjregion r s.t. Grj=1}(1eθ)g1j(eθe2θ)g2j(e2θ)g3j

(d) Е-крок. Дайте функціюQ(θ,θi)

Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθe2θ)N3loge2θ=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθ(1eθ))+2θN3=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3

деN1=j=1ng1j,N2=j=1ng2j,N3=j=1ng3j

(e) Дайте вирази для для .E[Xj|Grj=1,θi]r=1,2,3

Я перерахую свої результати, які, напевно, впевнені, що вони праві, але виведення цього питання буде досить довгим для цього вже тривалого питання:

E[Xj|G1j=1,θi]=(11eθi)(1θieθi(1+1/θi))E[Xj|G2j=1,θi]=(1eθie2θi)(eθi(1+1/θi)e2θi(2+1/θi))E[Xj|G3j=1,θi]=(1e2θi)(e2θi(2+1/θi))

Це частина, на яку я застрягла, і це може бути через попередню помилку:

(f) М-крок. Знайдіть що максимізуєθQ(θ,θi)

Із закону загальних очікувань у нас ThereforE[Xj|G,θi]=(1θieθi(1+1/θi))+(eθi(1+1/θi)e2θi(2+1/θi))+(e2θi(2+1/θi))=1/θi

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3=nlogθθnθiN1log(1eθ)+θN2N2log(1eθ)+2θN3Q(θ,θi)θ=nθnθi(N1+N2)eθ1eθ+N2+2N3

Далі я повинен встановити це рівне нулю і вирішити для , але я намагався це дуже довго, і я не можу вирішити для !θθ


Я тлумачив як силу протягом хвилини. Найбільш заплутано. Зазвичай номер ітерації (номер кроку) ставиться в дужках або в дужках щоб не плутати з ї потужністю . Напевно, найкраще хоча б сказати, що це питання в питанні (якщо припустити, я зараз маю це право). θiθ[i](i)θ(i)iθi
Glen_b -Встановіть Моніку

1
Так Глен, шкода , що це дійсно - й ітерації алгоритму EM. i
бдеонович

Відповіді:


5

Повна вірогідність даних не повинна включати G! Це просто повинна бути ймовірність коли є експоненціальними. Зауважте, що повноцінна ймовірність даних, як ви їх написали, спрощує експоненціальну ймовірність, оскільки лише однією з може бути 1. Залишивши групу в повній вірогідності даних, однак, ви заплутаєте вас згодом. θXGrjG

Частина (d) повинна приймати очікування вірогідності повного журналу даних, а не вірогідності спостережуваного журналу даних.

Крім того, ви не повинні використовувати закон повного очікування! Нагадаємо, що G спостерігається і не є випадковим, тому вам слід виконувати лише одне з тих умовних очікувань для кожного . Просто замініть це умовне очікування терміном і виконайте M-крок.XjXj(i)


@Benjamin Як виникає проблема? Чи зміг я допомогти вам зрозуміти, як це зробити?
jsk

Дякуємо за коментарі @jsk. Я втомився вчора ввечері, тому я лягав спати, але я з цим
вирішуся

Я думаю, я це зрозумів! Ще раз дякую вам! Це насправді було підготовкою до фіналу, який я маю сьогодні, тож він справді допоміг з’ясувати деякі речі щодо ЕМ.
бдеонович

Ласкаво просимо. Сподіваюся, ваш фінал сьогодні пройде добре!
jsk

4

На основі коментарів від @ jsk я спробую виправити свої помилки:

L(θ|Х,Г)=j=1нθе-θхj

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]=nlogθθ(j=1ng1j1eθi)(1θieθi(1+1/θi))θ(j=1ng2jeθi(1eθi))(eθi(1+1/θi)e2θi(2+1/θi))θ(j=1ng3je2θi)(e2θi(2+1/θi))=nlogθθN1AθN2BθN3CQ(θ,θi)θ=nθN1AN2BN3C=set0

вирішуючи для отримуємоθθ(i+1)=nN1A+N2B+N3C

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.