MCMC; Чи можемо ми бути впевнені, що у нас ззаду є "чистий" і "досить великий" зразок? Як це може працювати, якщо нас немає?


12

Посилаючись на цю тему: Як би ви пояснили церкву Маркова Монте-Карло (MCMC) лайперсону? .

Я бачу, що це поєднання ланцюгів Маркова та Монте-Карло: Марківський ланцюг створюється із задньою частиною як інваріантний обмежуючий розподіл, а потім Монте-Карло малює (залежно) від обмежуючого розподілу (= наш задній).

Скажімо (я знаю, що тут я спрощую), що після кроків ми знаходимося в обмежувальному розподілі (*).ΠLΠ

Ланцюг Маркова, будучи послідовністю випадкових змінних, отримую послідовність , де - випадкова величина, а - обмежувальна ' 'випадкова величина' ', з якої ми хочемо взяти вибірку. X i ΠX1,X2,,XL,Π,Π,Π,ΠXiΠ

MCMC починається з початкового значення, тобто - випадкова величина з усією масою при цьому одному значенні . Якщо я використовую великі літери для випадкових змінних і малі літери для реалізації випадкової змінної, то MCMC видає мені послідовність . Отже довжина ланцюга MCMC дорівнює L + n.х 1 х 1 , х 2 , х 3 , ... х L , π 1 , π 2 , π 3 , . . . . π nX1x1x1,x2,x3,xL,π1,π2,π3,....πn

[[* Примітка: великі літери - це випадкові величини (тобто ціла купа результатів), а малі - результати, тобто одне конкретне значення. *]]x

Очевидно, що тільки належать моєму "задньому", а для апроксимації заднього "добре" значення повинно бути "досить великим". nπin

Якщо підсумувати це, у мене є ланцюжок MCMC довжиною , тільки є актуальними для мого заднього наближення, і має бути досить великим. N = L + n π 1 , π 2 , , π n nx1,x2,x3,xL,π1,π2,π3,....πnN=L+nπ1,π2,,πnn

Якщо я включу деякі з (тобто реалізацій до досягнення інваріантного розподілу) до обчислення апроксимації заднього, то це буде '' шумно ''.xi

Я знаю довжину ланцюга MCMC , але без знання , тобто кроку, на якому я впевнений для вибірки з обмежуючого розподілу, я не можу бути впевнений, що я не включив шум, і не можу будьте впевнені, що , розмір мого зразка від обмежувального розподілу, зокрема, я не можу бути впевнений, чи є він '' досить великий ''. L n = N - LN=L+nLn=NL

Отже, наскільки я зрозумів, це значення має вирішальне значення для якості наближення задньої частини (виключення шуму та великої вибірки з нього)L .

Чи є способи знайти розумну оцінку для коли я застосовую MCMC?L

(*) Я думаю, що загалом залежатиме від початкового значення .x 1Lx1

Відповіді:


6

TL DR; Ви не можете оцінити оскільки . Таким чином, спрощення припущення ніколи не може бути справді можливим. (Можливо, деякі випадки є, але це не в загальному світі MCMC). Однак ви можете вирішити, що зробить раннє зміщення невеликим.LL=N


По суті, ваше питання зводиться до "як ми можемо оцінити час вигорання?". Згорання - це викидання початкових зразків, оскільки ланцюг Маркова не зблизився. Існує багато діагностичних програм MCMC, які допомагають оцінити час «вигоряння», огляд їх можна переглянути тут .

Існують дві школи, що стосуються вигорання; популярним є використання однієї з таких діагностик, щоб вирішити, що таке , і викинути зразки , а друга школа через них, перші зразки не повинні мати значення, тому не хвилюйтеся про них. У Чарлі Гейєра є жорстокість щодо цього, з чим я згоден.LLL

Тепер я переходжу до більш технічних деталей вашого питання.

Спрощуючи припущення, яке ви робите у своєму запитанні, полягає в тому, що врешті-решт (після кроків) пробовідбірник почне малювати з обмежувального розподілу. Отже, ваші зразки після кроків - це чисті нічиї, хоч і співвідносні. Це неправда. Строго кажучи, є . Ланцюг Маркова ніколи по-справжньому не наближається до обмежувального розподілу в обмежений час. Тому оцінювати майже безглуздо.LLLL

Іншим способом поставити це питання є: що таке , що після кроків ланцюг Маркова "досить близько" до обмежуючого розподілу. Це питання, на яке намагаються відповісти діагностики. Все частіше погоджується, що діагностика, наведена вище, як правило, є надзвичайно ліберальною і може діагностувати "конвергенцію" набагато раніше, ніж вона повинна бути. Ось документ, який демонструє деякі слабкі сторони діагностики.LL

Вищенаведений просить користувачів , щоб зробити замість цього не турбуватися про , турбуватися про . Як правило, користувачів цікавить не повний задній розподіл, а конкретна кількість. Часто ця кількість є середнім значенням задньої чи будь-якої іншої функції, яку можна записати як очікування. Сюди входить "Монте-Карло" частина MCMC, оскільки Монте-Карло вказує на оцінку інтеграла з підсумовуванням. Отже, якщо - це ваш ланцюг Маркова (зауважте, як я , оскільки - ), і ми хочемо оцінити середнє значення заднього ( ), то LNX1,X2,X3,,XNLLθ

θ¯N=1Ni=1NXi.

Ідея полягає в тому, що якщо досить великий, то початкове зміщення вибірки буде незначним. Звичайно, якщо початкове значення було патетично далеко від простору високої ймовірності обмежуючого розподілу, користувач може забити м'яч і викинути перші пару зразків. Це відрізняється від оцінки , оскільки це не оцінка, а освічене нехтування чітко зіпсованими зразками.NL

Тепер питання, звичайно, таке: скільки має бути ? Відповідь повинна залежати від того, наскільки добре ми хочемо оцінити . Якщо ми хочемо великої оцінки, то ми хочемо більше зразків, якщо нормальна оцінка достатня, тоді ми можемо бути добре з меншою вибіркою. Це саме те, що відбувається в стандартних статистичних проблемах.Nθ

Те, як ми кількісно оцінюємо "корисність" оцінки, - це думати, "що можна сказати про , помилку в Монте-Карло? За розумних умов насправді існує ланцюг Маркова CLT, що говорить як , для будь-якого початкового розподілу(θ¯Nθ)N

N(θ¯Nθ)dNp(0,Σ),

де і - асимптотична матриця коваріації. Ключовим тут є те, що результат справедливий для будь-якого початкового розподілу. ΣθRpΣ

Коли невеликий, ми знаємо, що оцінювач хороший. У цій роботі представлена ​​ця ідея зупинки, і моя відповідь тут узагальнює їх метод. Результати в роботі також не залежать від початкового розподілу процесу.Σ/N


Thx для відповіді (+1) Я знаю, що має бути , я прямо сказав, що я спрощую. Що стосується вашого CLT, чи не повинен це бути для конвергенції в розподілі? а для - це обчислене після скидання значень спалювання, бо якщо це після їх скидання, проблема залишається? (чи можу я запитати, що означає TL DR?) Спасибі за папір, я детально її прочитавЕ / п θ NLΣ/nθ^N

Виправлена помилка, має бути . обчислюється з усіх зразків, нічого не випадає. TL DR означає "занадто довго, не читав". Я забув додати, що CLT справедливий для будь-якого початкового розподілу. Я додам це. ˉ θ NΣ/Nθ¯N
Грінпаркер

У мене є ще одне питання: у статті Flegal, Haran та Jones, MCMC: чи можемо ми підсунути третю значущу цифру , нижче формули (3) сказано, що передбачається, що . Чи означає це, що я повинен враховувати спалювання при оцінці ? ˉ g nX1πg¯n

@fcop Ця лінія є лише для того, щоб описати очікування. Не передбачається, що , але очікування щодо у формулі. πX1ππ
Грінпаркер
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.