Чому використовується алгоритм максимізації очікування?


22

З того, що я мало знаю, алгоритм ЕМ може бути використаний для пошуку максимальної ймовірності, коли встановлення на нуль часткових похідних стосовно параметрів вірогідності дає набір рівнянь, які неможливо вирішити аналітично. Але чи потрібен алгоритм ЕМ замість того, щоб використовувати якусь чисельну техніку, щоб спробувати знайти максимум ймовірності щодо обмеження набору згаданих рівнянь.

Відповіді:


20

Питання легітимне, і у мене була така ж плутанина, коли я вперше вивчив алгоритм ЕМ.

Загалом, алгоритм ЕМ визначає ітераційний процес, який дозволяє максимально збільшити ймовірність функції параметричної моделі в тому випадку, коли деякі змінні моделі є (або трактуються як) "прихованими" або невідомими.

Теоретично з цією ж метою можна використовувати алгоритм мінімізації, щоб чисельно знайти максимум функції ймовірності для всіх параметрів. Однак у реальній ситуації ця мінімізація буде такою:

  1. набагато більш обчислювально
  2. менш міцний

Дуже поширеним застосуванням ЕМ-методу є встановлення моделі суміші. У цьому випадку з огляду на змінну, яка присвоює кожному зразку одному з компонентів як "прихованих" змінних, проблема значно спрощується.

s={si}

logL(x,θ)=log[a1exp((xμ1)22σ12)+a2exp((xμ2)22σ22)]

μkσklogL(x,θ) .


12

X=(X1,...,Xn)fX|Θ(x|θ)

l(θ;X)=logfX|Θ(X|θ)
XYZX=(Y,Z)
lobs(θ,Y)=logfX|Θ(Y,z|θ)νz(dz)
lobs(θ,Y)i(i+1)th
Q(θ|θ(i))=Eθ(i)[l(θ;X|Y]
θ(i)ΘithQ(θ|θ(i))θθ(i+1)=maxQ(θ|θi). Потім ви повторюєте ці кроки, поки метод не наблизиться до якогось значення, яке буде вашою оцінкою.

Якщо вам потрібна додаткова інформація про метод, його властивості, докази чи застосування, просто перегляньте відповідну статтю Wiki .


1
+1 ... ЕМ не тільки для випадку пропущених значень.
Glen_b -Встановити Моніку

@Andy: Навіть розглядаючи випадок відсутніх даних, я все ще не розумію, чому використання загальних чисельних методів знайти точку, коли часткові похідні дорівнюють нулю, не працює.
користувач782220

Дякую Глен, я знав це лише в контексті відсутніх значень / прихованих змінних. @ user782220: коли ви не можете мати рішення закритої форми похідної вірогідності журналу, встановлення похідної, рівної нулю, не визначить ваш параметр. Ось чому ви використовуєте числові методи в цьому випадку. Для пояснення та прикладу дивіться лекцію тут: people.stat.sfu.ca/~raltman/stat402/402L5.pdf
Енді

1

ЕМ використовується, тому що часто неможливо або неможливо безпосередньо обчислити параметри моделі, що максимально збільшує ймовірність набору даних, що дається для цієї моделі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.