Чи відбір проб на основі Маркова є "найкращим" для відбору проб Монте-Карло? Чи є альтернативні схеми?


10

Ланцюг Маркова Монте-Карло - це метод, заснований на ланцюгах Маркова, який дозволяє отримувати зразки (в умовах Монте-Карло) з нестандартних розподілів, з яких ми не можемо безпосередньо брати зразки.

Моє запитання, чому ланцюжок Маркова є "найсучаснішим" для відбору проб Монте-Карло. Альтернативним питанням може бути, чи існують інші способи, як ланцюги Маркова, які можна використовувати для відбору проб Монте-Карло? Я знаю (принаймні, з огляду літератури), що MCMC має глибокі теоретичні корені (з точки зору (а) періодичності, однорідності та детального балансу), але цікаво, чи існують якісь "порівнянні" ймовірнісні моделі / методи для Монте Вибірка Карло схожа на ланцюги Маркова.

Підкажіть, будь ласка, якщо я переплутав якусь частину питання (або якщо це взагалі здається заплутаним).

Відповіді:


11

Немає жодних підстав стверджувати, що вибірки MCMC - це "найкращий" метод Монте-Карло! Зазвичай, це навпаки гірше, ніж проба вибірки, хоча б з точки зору дисперсії отриманих оцінок Монте-Карло Дійсно, хоча це середнє значення зближується з очікуванням коли - стаціонарний і обмежуючий розподіл ланцюга Маркова , при використанні методів MCMC є щонайменше два недоліки:

1Tt=1Th(Xt)
Eπ[h(X)]π(Xt)t
  1. Ланцюг повинен "досягти стаціонарності", це означає, що йому потрібно забути про початкове значення . Іншими словами, має бути "досить великим", щоб поширювався з . Іноді "достатньо великий" може перевищувати на кілька порядків бюджет обчислення для експерименту.X0tXtπ
  2. Значення співвідносяться, що призводить до асимптотичної дисперсії, яка включає які як правило, перевищує і, отже, потрібні більш тривалі імітації, ніж для iid вибірки.Xt
    varπ(X)+2t=1covπ(X0,Xt)
    varπ(X)

З цього приводу, MCMC дуже корисний для обробки параметрів, коли регулярний вибірковий вибір в iid неможливий або занадто затратний і де вибірку важливості досить важко відкалібрувати, зокрема через розмірність випадкової змінної, що підлягає моделюванню.

Однак послідовні методи Монте-Карло, такі як фільтри для частинок, можуть бути більш доречними в динамічних моделях, де дані надходять через вибухи, які потребують негайної уваги і можуть навіть зникнути (тобто не можуть бути збережені) через короткий час.

На закінчення, MCMC є дуже корисним (і дуже використовуваним) інструментом для обробки складних налаштувань, коли звичайні рішення Монте-Карло не вдається.


8

Існує кілька способів генерування випадкових значень з розподілу, McMC - один з них, але кілька інших також вважалися б методами Монте-Карло (без ланцюгової частини Маркова).

Найбільш прямим для одновимірного відбору проб є генерування рівномірної випадкової величини, а потім підключення її до зворотної функції CDF. Це чудово спрацьовує, якщо у вас є зворотний CDF, але це клопітно, коли CDF та / або його інверсія важко обчислити безпосередньо.

Для багатоваріантних проблем ви можете генерувати дані з копули, а потім використовувати зворотний метод CDF на згенерованих значеннях, щоб мати певний рівень кореляції між змінними (хоча для визначення правильних параметрів для копули для отримання бажаного рівня кореляції часто потрібно трохи біт метод спроб і помилок).

Вибірка відхилення - це ще один підхід, який можна використовувати для отримання даних з розподілу (однофакторного або багатоваріантного), де вам не потрібно знати CDF або його зворотну (і вам навіть не потрібна нормалізуюча константа для функції щільності), але це може бути дуже неефективно в деяких випадках, забираючи багато часу.

Якщо вас цікавлять зведення згенерованих даних, а не самі випадкові точки, вибір вибір важливості - це ще один варіант.

Вибірка Гіббса, яка є формою відбору проб McMC, дозволяє вибирати там, де ви не знаєте точної форми багатофакторного розподілу, доки ви знаєте умовний розподіл для кожної змінної з огляду на інші.

Є й інші, що найкраще залежить від того, що ви знаєте, а що не знаєте, та інших деталей конкретної проблеми. McMC популярний тим, що добре працює в багатьох ситуаціях і узагальнює для багатьох різних випадків.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.