Розуміння MCMC: якою була б альтернатива?


13

Вивчення байєсівської статистики вперше; як кут до розуміння MCMC я задумався: чи це робиться щось, що принципово не можна зробити іншим способом, чи це просто робити щось набагато ефективніше, ніж альтернативи?

Для ілюстрації, припустимо, що ми намагаємося обчислити ймовірність наших параметрів за даними даною моделлю, яка обчислює навпаки, . Щоб обчислити це безпосередньо за теоремою Байєса, нам потрібен знаменник як зазначено тут . Але чи можна це обчислити, інтегруючи, сказати так:P ( D | x , y , z ) P ( D )П(х,у,z|D)П(D|х,у,z)П(D)

p_d = 0.
for x in range(xmin,xmax,dx):
    for y in range(ymin,ymax,dy):
        for z in range(zmin,zmax,dz):
            p_d_given_x_y_z = cdf(model(x,y,z),d)
            p_d += p_d_given_x_y_z * dx * dy * dz

Чи може це працювати (хоч і дуже неефективно з більшою кількістю змінних) чи є щось інше, що призвело б до невдачі такого підходу?


4
Інтеграція працювала б у багатьох випадках, але це зайняло б занадто багато часу (тобто неефективне). MCMC - це спосіб ефективно оцінити задній.
Марк Білий

3
Не важливо для питання, але я думаю, що у вашому інтегралі відсутнє попереднє значення над x, y, z (воно з'являється у чисельнику формули Байєса)
Альберто

Відповіді:


17

Ви описуєте наближення сітки до задньої, і це правильний підхід, хоча і не найпопулярніший. Існує досить багато випадків, коли задній розподіл можна обчислити аналітично. Ланцюги Монте-Карло Маркова або інші приблизні методи - це методи отримання зразків заднього розподілу, які іноді спрацьовують, коли аналітичного рішення неможливо знайти.

Аналітичні рішення, які можна знайти, є типовими випадками "об'єднаних" сімей, і ви можете дізнатися більше про це за допомогою googling, див., Наприклад, https://en.wikipedia.org/wiki/Conjugate_prior .

В якості першого прикладу, якщо ваш попередній показник pрівномірний [0, 1], де pпараметр успіху у простому біноміальному експерименті, задній дорівнює розподілу бета-версії. Інтеграція, або підсумовування, в цьому випадку можна зробити явно.

Якщо у вас є безліч варіантів вибору параметрів або ви використовуєте наближення до сітки, як у вашому прикладі, просте підсумовування може бути всього, що вам потрібно. Кількість обчислень може швидко вибухнути, якщо у вас є пара змінних і ви хочете використовувати щільну сітку.

Існує кілька алгоритмів відбору проб із задньої частини. Гамільтонівський Монте-Карло, зокрема пробовідбірник NUTS, зараз популярний і використовується в, stanа PyMC3Метрополіс Гастінгс - класика. Варіаційний висновок - відносний прибуток, а фактично не метод вибірки, а інший спосіб отримання апроксимації. Наразі жоден із методів, включаючи аналітичні рішення, не є найкращим, всі вони добре працюють у конкретних випадках.


Хороша відповідь, але ваш останній абзац, мабуть, означає, що варіативний висновок - це метод вибірки, який не є. Ви можете подумати, щоб виправити це.
Рубен ван Берген

7

Обчислення знаменника не допомагає зрозуміти природу заднього розподілу (або будь-якого розподілу). Як обговорювалося в недавньому запитанні , потрібно знати, що щільність d-мірного вектора дорівнює не підказує мені, де є області, що представляють інтерес для цього заднього розподілу.θ

π(θ|х)досвід{-||θ-х||2-||θ+х||4-||θ-2х||6},х,θг,

6

Методи Монте-Карло - це методи, які використовують випадкові числа. Мета - знайти зразки , які розподіляються відповідно до і передбачається, що є складним. Це означає, що ми не можемо оцінити це безпосередньо. Якщо це не так, ви можете просто обчислити це аналітично. Як у вашому прикладі це буде .хП(х)П(х)П(D)

Що ви пропонуєте, це по суті пошук сітки через простір і . Це може бути дуже вичерпним, якщо і є великими розмірами і нездійсненними, якщо вони безперервні. Ще одна проблема полягає в тому, що вам потрібно обчислити PDF на кожному кроці.хуху

Методи MCMC намагаються вирішити це, пропонуючи кандидатські зразки а потім приймаючи або відкидаючи їх залежно від певного заходу. Теоретично це може бути швидше, ніж проходження всіх можливих комбінацій. тому в основному ви знаходите зразки, які беруть з попереднього . Теоретична проблема тут полягає в тому, що це стосується лише граничної кількості відібраних проб, тобто після зразків. Тож ви не знаєте, коли зупинити Мережу Марків.ciП(D)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.