Я намагаюся зрозуміти внутрішню роботу Гамільтоніана Монте-Карло (HMC), але не можу повністю зрозуміти ту частину, коли ми замінимо детерміновану інтеграцію часу на пропозицію Метрополіс-Гастінг. Я читаю дивовижний вступний документ «Концептуальне вступ до гамільтоніану Монте-Карло » Майкла Бетанкура, тому я буду дотримуватися тих же позначень, які використовуються в ньому.
Фон
Загальна мета ланцюга Маркова Монте-Карло (MCMC) - наблизити розподіл цільової змінної .
Ідея HMC полягає у запровадженні допоміжної змінної "імпульсу" , в поєднанні з вихідною змінною що моделюється як "позиція". Пара імпульсів позиції утворює розширений фазовий простір і може бути описана динамікою Гамільтона. Спільний розподіл можна записати у вигляді мікроканонічного розкладання:
,
де представляє параметри на заданому енергетичному рівні , також відомий як типовий набір . Для ілюстрації див. Фіг. 21 та фіг. 22 паперу.
Оригінальна процедура HMC складається з наступних двох чергуються етапів:
Стохастичний крок, який виконує випадковий перехід між рівнями енергії та
Детермінований крок, який виконує інтеграцію часу (зазвичай реалізується за допомогою цифрової інтеграції стрибкоподібної форми) уздовж заданого рівня енергії.
У статті стверджується, що у стрибка (або симплектичного інтегратора) є невеликі помилки, які вводять числовий зміщення. Отже, замість того, щоб ставитися до цього як до детермінованого кроку, ми повинні перетворити його на пропозицію Metropolis Hasting (MH), щоб зробити цей крок стохастичним, і отримана в результаті процедура отримає точні зразки з розподілу.
Пропозиція МЗ виконає кроки операцій стрибків, а потім переверніть імпульс. Потім пропозиція буде прийнята з такою ймовірністю прийняття:
Запитання
Мої запитання:
1) Чому ця модифікація перетворення детермінованої інтеграції часу у пропозицію про МЗ скасовує числове зміщення, щоб згенеровані вибірки точно відповідали цільовому розподілу?
2) З точки зору фізики, енергія зберігається на заданому енергетичному рівні. Ось чому ми можемо використовувати рівняння Гамільтона:
.
У цьому сенсі енергія повинна бути постійною скрізь на типовому наборі повинна дорівнювати . Чому існує різниця в енергії, яка дозволяє побудувати ймовірність прийняття?