Чому потрібен MCMC при оцінці параметра за допомогою MAP


11

З огляду на формулу для оцінки параметра MAP для Оцінка параметрів MAP чого потрібен підхід MCMC (або подібний), я не міг просто взяти похідну, встановити її в нуль і потім вирішити для параметра?


Чудове запитання!

Відповіді:


4

Якщо ви знаєте, з якої родини походить ваша особа, і якщо пошук похідної від цього розподілу є аналітично можливим, це правильно.

Однак, коли ви використовуєте MCMC, ви, ймовірно, не опинитесь у такому типі ситуації. MCMC створений для ситуацій, коли у вас немає чіткого аналітичного поняття про те, як виглядає ваш задник.


3
Я думаю, це трохи вводить в оману: MCMC, як правило, не використовується для пошуку оцінки MAP (за межами спеціальних випадків, таких як алгоритм MCEM).
Кліф АВ

1
Я з вами принципово не згоден. Але MCMC може бути і використовується для імітації заднього розподілу . І як тільки ви це зробите, ви зможете точно знайти режим цього розподілу, також MAP. Який, я вважаю, те, що мав на увазі ОП, тому я не зовсім впевнений, чому моя відповідь була б оманливою.
Крістоф Хенк

Так, чи є MCMC методом вибору при роботі з MAP, якщо немає аналітичного способу оптимізації параметра?
Дану

3
Я ніколи не чув, щоб використовувати простий MCMC для пошуку режиму заднього розподілу (технічно це можна зробити, але це вкрай неефективно). Оскільки ми зазвичай можемо оцінити функцію, пропорційну задньому розподілу, максимізація цього буде еквівалентна максимізації заднього розподілу. Оптимізатори поза межами коробки працюватимуть так само добре, як і будь-яка проблема частопелістичної ймовірності (тобто, іноді вам потрібно буде спеціалізуватися на них).
Кліф АВ

@ Dänu Ви, мабуть, не хочете використовувати MCMC (щоб бути педантичним, ланцюжок Маркова), щоб знайти максимуми. Алгоритм оптимізації повинен працювати краще.
jtobin

10

Більшість плакатів виявляється складно оптимізувати аналітично (тобто, взявши градієнт і встановивши його рівним нулю), і вам доведеться вдатися до численного алгоритму чисельної оптимізації, щоб зробити MAP.

Як бік: MCMC не пов'язаний з MAP.

MAP - для максимального a posteriori - означає знаходження локального максимуму чогось пропорційного задній щільності та використання відповідних значень параметрів як оцінок. Визначається як

θ^MAP=argmaxθp(θ|D)

MCMC зазвичай використовується для наближення очікувань щодо чогось пропорційного щільності ймовірності. У випадку з задньою, це

θ^MCMC=n1i=1nθi0Θθp(θ|D)dθ

де - це сукупність позицій простору параметрів, які відвідує відповідний ланцюг Маркова. Загалом, у будь-якому змістовному сенсі.thetas ; M A P ≠ & thetas ; M C M C{θi0}i=1nθ^MAPθ^MCMC

Суть у тому, що MAP включає оптимізацію , тоді як MCMC базується на вибірці .


Ви заявляєте, що позиціонерам виявляється складно оптимізувати аналітично, як це стосується MAP. Тож чи можливий MAP лише в тому випадку, якщо задній може бути оптимізований аналітично і якщо це не так, потрібно вдатися (наприклад) до підходу MCMC?
Дану

2
Ні, замість того, щоб прийти з аналітичним рішенням, можна використовувати ітеративний алгоритм, щоб придумати рішення (тобто, якщо задня частина журналу увігнута, ви можете, наприклад, використовувати метод Ньютона).
Кліф АВ

2
MAP позначає пошук значень параметрів, які (локально) максимізують задній. Не має значення, як ви отримуєте ці значення параметрів: розв’язування максимумів аналітичним шляхом, використовуючи числову процедуру, автоматичну диференціацію тощо
jtobin
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.