Метод MLE може бути застосований у випадках, коли хтось знає основну функціональну форму pdf (наприклад, це гауссова, або нормальна для журналу, експоненціальна чи будь-яка інша), але не основні параметри; наприклад, вони не знають значень та в pdf: або будь-який інший тип pdf, який вони передбачають. Завдання методу MLE полягає у виборі найкращих (тобто найбільш правдоподібних) значень для невідомих параметрів, враховуючи конкретні вимірювання даних які насправді спостерігали . Отже, щоб відповісти на ваше перше запитання, так, ви завжди в межах своїх прав запитати когось щоσ f ( x | μ , σ ) = 1мкσх1,х2,х3,. . .
f( x | μ , σ) = 12 πσ2----√досвід[ - ( х - мк )22 σ2]
х1, х2, х3, . . .форма pdf, яку вони передбачають для максимальної оцінки ймовірності; Дійсно, оцінені значення параметрів, які вони вам кажуть, навіть не мають сенсу, якщо вони спочатку не передають цей контекст.
Як я вже бачив, алгоритм ЕМ застосовується раніше, це свого роду мета алгоритм, де деякі метадані відсутні, і ви також повинні це оцінити. Так, наприклад, можливо, у мене є pdf, який є сумішшю кількох гауссів, наприклад: поверхово, за винятком додавання параметра амплітуди , це схоже на попередню проблему, але що робити, якщо я сказав вам, що ми навіть не знаємо значення (тобто кількість режимів в гауссовій суміші) і ми хочемо підрахувати, що з вимірювань даних
f( х | А1, . . . , AN, мк1, . . . , мкN, σ1, . . . σN) = ∑k = 1NАк2 πσ2к----√досвід[ - ( х - мкк)22 σ2к]
АкNх1, х2, х3, . . . теж?
У цьому випадку у вас виникає проблема, оскільки кожне можливе значення (це «мета» частина, про яку я нагадав вище) справді породжує іншу модель, в якомусь сенсі. Якщо , то у вас є модель з трьома параметрами ( , , ), тоді як якщо , то у вас є модель з шістьма параметрами ( , , , , , ). Найбільш оптимальні значення, які ви отримаєте для ( , , ) уNN=1A1μ1σ1N=2A1A2μ1μ2σ1σ2A1μ1σ1N=1Модель безпосередньо не може порівнюватися із значеннями найкращого пристосування, які ви отримуєте для тих самих параметрів у моделі , оскільки це різні моделі з різною кількістю ступенів свободи .N=2
Роль алгоритму EM є створення механізму для створення цих типів порівнянь ( як правило , шляхом накладення «складності штрафу» , який вважає за краще менші значення ) , так що ми можемо вибрати краще загальне значення для .NN
Отже, щоб відповісти на ваше первісне запитання, алгоритм ЕМ вимагає менш точної конкретизації форми pdf; можна сказати, що він розглядає цілий ряд альтернативних варіантів (наприклад, варіант, де , , і т.д.), але він все ще вимагає вказати щось про основну математичну форму цих варіантів ... Ви все ще повинні в певному сенсі вказати "сімейство" можливих pdfs, навіть якщо ви дозволяєте алгоритму вирішувати для вас, який "член" сім'ї забезпечує найкраще відповідність даним.N=1N=2N=3