Питання легітимне, і у мене була така ж плутанина, коли я вперше вивчив алгоритм ЕМ.
Загалом, алгоритм ЕМ визначає ітераційний процес, який дозволяє максимально збільшити ймовірність функції параметричної моделі в тому випадку, коли деякі змінні моделі є (або трактуються як) "прихованими" або невідомими.
Теоретично з цією ж метою можна використовувати алгоритм мінімізації, щоб чисельно знайти максимум функції ймовірності для всіх параметрів. Однак у реальній ситуації ця мінімізація буде такою:
- набагато більш обчислювально
- менш міцний
Дуже поширеним застосуванням ЕМ-методу є встановлення моделі суміші. У цьому випадку з огляду на змінну, яка присвоює кожному зразку одному з компонентів як "прихованих" змінних, проблема значно спрощується.
s={si}
−logL(x,θ)=−log[a1exp((x−μ1)22σ21)+a2exp((x−μ2)22σ22)]
μkσk−logL(x,θ) .