Чому надлишкова середня параметризація прискорює Gibbs MCMC?


12

У книзі Gelman & Hill (2007) (Аналіз даних за допомогою регресії та багаторівневих / Ієрархічних моделей) автори стверджують, що включення надлишкових середніх параметрів може допомогти прискорити MCMC.

Наведений приклад - це вкладена модель "тренажера польоту" (урівень 13.9):

yiN(μ+γj[i]+δk[i],σy2)γjN(0,σγ2)δkN(0,σδ2)

Вони рекомендують репараметризацію, додаючи середні параметри та μ δ наступним чином:μγμδ

γjN(μγ,σγ2)δkN(μδ,σδ2)

Єдине пропоноване виправдання: (стор. 420):

Можливо, що симуляції застрягли в конфігурації, де весь вектор (або δ ) далекий від нуля (навіть якщо їм призначено розподіл із середнім значенням 0). Зрештою, симуляції сходяться до правильного розподілу, але нам не хочеться чекати.γδ

Як надлишкові середні параметри допомагають вирішити цю проблему?

Мені здається, що вкладена модель повільна, головним чином через і δ , негативно корелюють. (Дійсно, якщо один піднімається вгору, інший повинен знизитися, враховуючи, що їх сума "фіксується" даними). Чи допомагають надлишкові середні параметри зменшити кореляцію між γ і δ чи щось інше цілком?γδγδ


γδγμδμ

Мені б хотілося інтуїтивно зрозуміти концепцію ієрархічного центрування загалом (оскільки конкретний випадок у питанні - це безпосередньо застосування ієрархічного центрування). Ключовий момент, про який я хочу зрозуміти, це: чому діє ієрархічне центрування, якщо дисперсія на рівні групи становить значну частину загальної дисперсії ? Документ Gelfand та ін. це доводить математично (тобто вивести кореляцію та знайти її обмежувальну поведінку), але без будь-якого інтуїтивного пояснення.
Гейзенберг

Відповіді:


4

μγjδk

γjδkμ

Дивіться для чіткого опису розділ 25.1 "Що таке ієрархічне центрування?" у книзі (у вільному доступі) «Оцінка MCMC у MLwiN» Вільяма Дж. Брауна та інших. http://www.bristol.ac.uk/cmm/software/mlwin/download/manuals.html


Розділ 25.1 "MCMC оцінки MlwiN" описує цю методику "ієрархічного центрування", але не вникає в деталі, крім того, що стверджує, що вона працює. Розглядаючи його посилання, я виявив, що фактичне доведення цієї методики представлено у статті Ефективні параметризації для нормальних лінійних змішаних моделей , Гельфанд та ін., Biometrika vol 82 випуск 3.
Гейзенберг,

У статті вище, в свою чергу, використовуються властивості нормального розподілу без пояснення. Я знайшов докази цих властивостей у кон'югатному байєсівському аналізі розподілу Гаусса Кевіном Мерфі.
Гейзенберг

На жаль, я досі не бачив інтуїтивного пояснення, чому ця методика працює.
Гейзенберг

Пізно, але я думаю, цей документ може бути тим, що ви шукаєте
baruuum
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.