Це проблема практики для середньострокового іспиту. Проблема - приклад алгоритму ЕМ. У мене виникають проблеми з частиною (f). Я перераховую частини (а) - (д) для завершення, і якщо я помилився раніше.
Нехай - незалежні експоненціальні випадкові величини зі швидкістю . На жаль, фактичні значення не спостерігаються, і ми лише спостерігаємо, чи знаходяться значення в певні інтервали. Нехай , і для . Дані, що спостерігаються, складаються з .X1,…,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2}G3j=1{Xj>2}j=1,…,n(G1j,G2j,G3j)
(a) Наведіть імовірність спостережуваних даних:
L(θ|G)=∏j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=∏j=1n(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3j
(b) Надайте повну вірогідність даних
L(θ|X,G)=∏j=1n(θe−θxj)G1j(θe−θxj)G2j(θe−θxj)G3j
(c) Отримати прогнозну щільність прихованої змінноїf(xj|G,θ)
f(xj|G,θ)=fX,G(xj,g)fG(g)=θe−θxj1{xj∈region r s.t. Grj=1}(1−e−θ)g1j(e−θ−e−2θ)g2j(e−2θ)g3j
(d) Е-крок. Дайте функціюQ(θ,θi)
Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)−N2log(e−θ−e−2θ)−N3loge−2θ=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)−N2log(e−θ(1−e−θ))+2θN3=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3
деN1=∑nj=1g1j,N2=∑nj=1g2j,N3=∑nj=1g3j
(e) Дайте вирази для для .E[Xj|Grj=1,θi]r=1,2,3
Я перерахую свої результати, які, напевно, впевнені, що вони праві, але виведення цього питання буде досить довгим для цього вже тривалого питання:
E[Xj|G1j=1,θi]E[Xj|G2j=1,θi]E[Xj|G3j=1,θi]=(11−e−θi)(1θi−e−θi(1+1/θi))=(1e−θi−e−2θi)(e−θi(1+1/θi)−e−2θi(2+1/θi))=(1e−2θi)(e−2θi(2+1/θi))
Це частина, на яку я застрягла, і це може бути через попередню помилку:
(f) М-крок. Знайдіть що максимізуєθQ(θ,θi)
Із закону загальних очікувань у нас
ThereforE[Xj|G,θi]=(1θi−e−θi(1+1/θi))+(e−θi(1+1/θi)−e−2θi(2+1/θi))+(e−2θi(2+1/θi))=1/θi
Q(θ,θi)∂Q(θ,θi)∂θ=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3=nlogθ−θnθi−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3=nθ−nθi−(N1+N2)e−θ1−e−θ+N2+2N3
Далі я повинен встановити це рівне нулю і вирішити для , але я намагався це дуже довго, і я не можу вирішити для !θθ