Це питання, що повторюється (див. Цю публікацію , цю публікацію та цю публікацію ), але у мене інший виток.
Припустимо, у мене є купа зразків із загального пробовідбору MCMC. Для кожного зразка я знаю значення ймовірності журналу та журналу попереднього . Якщо це допомагає, я також знаю значення ймовірності журналу на точку даних (ця інформація допомагає певним методам, таким як WAIC та PSIS-LOO).log f ( x | θ ) log f ( θ ) log f ( x i | θ )
Я хочу отримати (грубу) оцінку граничної ймовірності, лише із наявними у мене вибірками та, можливо, декількома іншими оцінками функцій (але не переставляючи спеціальну MCMC).
Перш за все, давайте очистимо таблицю. Усі ми знаємо, що гармонійний оцінювач - це найгірший оцінювач коли-небудь . Перейдемо далі. Якщо ви робите вибірки Гіббса з пріорами та плакаторами у закритому вигляді, ви можете скористатися методом Чіба ; але я не впевнений, як узагальнити поза цими випадками. Є також методи, які вимагають від вас змінити процедуру вибірки (наприклад, через загартовані плакати ), але мене тут це не цікавить.
Підхід, про який я думаю, складається з наближення базового розподілу до параметричної (або непараметричної) форми , а потім з'ясування константи нормалізації як задачі оптимізації 1-D (тобто що мінімізує деяку помилку між і , оціненими на вибірках). У найпростішому випадку, припустимо, що задня частина є приблизно багатоваріантною нормою, я можу помістити як багатоваріантну нормальну і отримати щось подібне до наближення Лапласа (можливо, я хотів би використати кілька додаткових оцінок функції для уточнення позиції режим). Однак я міг би використовувати якZ Z Z g ( θ ) f ( x | θ ) f ( θ ) g ( θ ) g ( θ )більш гнучка сім'я, така як варіаційна суміш багатоваріантних розподілів.
Я розумію, що цей метод працює лише у тому випадку, якщо є розумним наближенням до , але будь-яка причина чи застережлива розповідь про те, чому було б дуже нерозумно Зроби це? Будь-яке читання, яке б ви порекомендували?f ( x | θ ) f ( θ )
Повністю непараметричний підхід використовує деяке непараметричне сімейство, наприклад Гауссовий процес (GP), для наближення (або якесь інше нелінійне перетворення його, наприклад як квадратний корінь), а байєсівська квадратура неявно інтегрується над базовою ціллю (див. тут і тут ). Це здається цікавим альтернативним підходом, але аналогічним за духом (також зауважте, що лікарі загальної практики були б непростими в моєму випадку).