Чому нам потрібен сюжетний графік для результатів MCMC


12

Я читаю дослідницькі роботи, використовуючи методи MCMC, і бачу, що більшість із них надають сюжетні графіки. Навіщо нам потрібні слідові ділянки в ланцюзі Монте-Карло Марків? Що вказує траєкторію параметрів?

Відповіді:


17

Ви створюєте графіки трасування параметрів, щоб переконатися, що ваш апріорний розподіл добре відкалібрований, що вказується на ваші параметри, що мають достатньо змін стану, коли працює алгоритм MCMC.

Крайнім прикладом є те, що ви встановлюєте апріорну дисперсію розподілу у 0. Тоді оцінка заднього параметра ніколи не зміниться. Ваш алгоритм скаже, що у вас найкраща оцінка параметрів, але він не перевірив достатню кількість параметрів, щоб визначити, чи справді це найкраще підходить. Якщо встановити дисперсію апріорного розподілу занадто високою, ви отримаєте подібну проблему. Це пояснюється тим, що новий параметр рідше пов’язаний з вашими даними, тому ймовірність журналу, обчислена з вашим новим параметром, швидше за все, не буде кращою, ніж ймовірність журналу, використовуючи старий параметр. (Наприклад, якщо ваш "істинний" параметр становить 0,5, а ваша початкова оцінка - 2, але ви вибираєте з звичайного розподілу із середнім значенням 2 та дисперсією 10000, то навряд чи ви отримаєте параметр, який ближче до 1 .

Вам потрібно вибрати апріорну дисперсію, яка дозволяє вашим параметрам параметрів змінюватись достатньо, щоб ви не зациклювалися на локальних мінімумах та максимумах у розподілі правдоподібності логіки, але все-таки досить добре, щоб отримати розумні оцінки параметрів. Більшість літератури пропонує отримати параметри для зміни станів 40-60% часу.

Ще одна причина виникнення сюжетних сюжетів - це спалювання. Зазвичай час запису в графіку очевидний (наприклад, якщо істинний параметр становить 1,5, а ваша початкова оцінка - 4, то ви повинні побачити, що оцінки параметрів швидко переміщуються від 4 до 1,5 а потім "підстрибуючи" близько 1,5). Як правило, ви просто виключаєте перші n ітерацій, де n досить великий, що ви впевнені, що ви видалили опік (скажімо, 1000), але якщо обчислення займають багато часу або якщо для ваших оцінок параметрів потрібно збільшити більше часу, ніж ваш n дозволяє, тоді ви можете пропустити більш-менш спостереження для обліку запису. Ви можете перевірити свої сюжети, щоб побачити, де закінчується опік у періоді, щоб переконатися, що запис не впливає на ваші результати.

Зауважте, що я говорив у контексті оцінок точок параметрів. Якщо ви оцінюєте дисперсію параметрів, то ще більш важливим є забезпечення відповідних змін стану.


5
+1 Але інша сторона полягає в тому, що ми не повністю довіряємо офіційній діагностиці конвергенції і хочемо щось зав'язати перед тим, як стверджувати, що воно зближене. Чи це цілком раціонально - це інше питання ...
сполучатипред

1
Вибачте, щоб викопати цю стару публікацію. Але чи не слід вважати, що попереднє значення (сформоване з попереднього розподілу) не має значення, якщо існує достатня кількість ітерацій?
mscnvrsy

@mscnvrsy: ви можете поставити неінформативні пріоритети, наприклад, попередні або єдині до Джефрі, якщо ви хочете надати менше інформації своєму попередньому.
Бензамін

3
Я повністю не погоджуюся з думкою, що сюжетні графіки MCMC будь-яким чином пов'язані з калібруванням попереднього розподілу. Алгоритм MCMC спрямований на заданий задній розподіл, не має значення для вибору попереднього і за належних умов створює ланцюг Маркова, який сходиться до цього стаціонарного розподілу. Перегляд ділянок мікроелементів корисний лише для оцінки конвергенції або відсутності ланцюга Маркова.
Сіань
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.