Я постійно читаю про необхідність перевірки на автокореляцію в MCMC. Чому важливо, щоб автокореляція була низькою? Що він вимірює в контексті MCMC?
Я постійно читаю про необхідність перевірки на автокореляцію в MCMC. Чому важливо, щоб автокореляція була низькою? Що він вимірює в контексті MCMC?
Відповіді:
Автокореляція - це міра того, наскільки значення сигналу співвідноситься з іншими значеннями цього сигналу в різні моменти часу. У контексті MCMC автокореляція - це міра того, наскільки незалежні різні зразки від вашого заднього розподілу - нижча автокореляція, що вказує на більш незалежні результати.
Коли ви маєте високу автокореляцію, то намальовані зразки не відображають точно задній розподіл, а тому не надають важливої інформації для вирішення проблеми. Іншими словами, нижча автокореляція означає більш високу ефективність у ваших ланцюгах та кращі оцінки. Загальне правило полягає в тому, що чим нижче ваша автокореляція, тим менше зразків потрібно для ефективності методу (але це може бути надто спрощеним).
По-перше, і, очевидно, якщо автокореляція висока, то N зразків не дають вам N інформації про ваш розподіл, але менше, ніж це. Ефективний розмір вибірки (ESS) - це міра того, скільки інформації ви дійсно отримуєте (і це функція параметра автокореляції).
Крім того, автокореляція дає вам представницькі зразки "в короткий термін". Більше того, чим більше існує автокореляція, тим довше "короткий пробіг". Для дуже сильної автокореляції короткостроковий період може бути хорошою часткою від ваших загальних зразків. Звичайні прямі засоби захисту - це параметризація або вибіркові параметри, які, як ви очікуєте, будуть взаємозв’язані в блоках, а не окремо, оскільки в іншому випадку вони будуть генерувати автокореляцію в ланцюзі. Люди часто також «худі», хоча є певна дискусія про те, наскільки це корисно для вирішення основної проблеми, наприклад, тут . Kass 1997 - це неофіційна дискусія з цих питань, хоча, мабуть, є щось нове, що можуть рекомендувати інші.
Коротше кажучи, сильно автокорельований ланцюг займає більше часу, щоб дістатися від початкових умов до потрібного розподілу, хоча він є менш інформативним і займає більше часу для вивчення цього розподілу, коли він туди потрапить.