Коли використовувати техніку bootstrap vs. bayesian?


12

У мене досить складна проблема аналізу рішень, пов’язана з тестуванням надійності, і логічний підхід (мені здається) передбачає використання MCMC для підтримки байєсівського аналізу. Однак було висловлено припущення, що було б доцільніше використовувати підхід до завантаження. Чи може хтось запропонувати довідку (або три), яка може підтримувати використання будь-якої техніки над іншою (навіть для конкретних ситуацій)? FWIW, у мене є дані з декількох різних джерел і мало / нульове спостереження. У мене також є дані на підсистемі та системному рівні.

Здається, таке порівняння має бути доступним, але мені не пощастило шукати звичайних підозрюваних. Заздалегідь дякую за будь-які покажчики.


1
Зважаючи на те, що класичний завантажувальний інструмент може розглядатися як комп'ютерно реалізований метод максимальної ймовірності (тобто, не-байесівський (плоский попередній) прийом), було б краще переформулювати своє запитання на щось на кшталт "коли використовувати метод частотистських та байесівських" ? " Деякі передумови завантаження: stats.stackexchange.com/questions/18469/…
Євген

1
Гммм..гадую, я не згоден. Сподіваємось, «завантажувальний пристрій» конкретно пропонує характеристику інтервалу; трохи більш цілеспрямований, ніж просто «частолістський». Принаймні «завантажувальний тренд» утримає більшість релігійних фанатиків. Також дякую за посилання, але я був знайомий з вашим попереднім коментарем, перш ніж публікувати це.
Aengus

1
Дозвольте перефразувати, чи є у вас якась корисна попередня інформація, чи проблема має ієрархічну (вкладену) структуру? Якщо так, то байєсівська техніка, мабуть, краща (особливо якщо кількість параметрів моделі велике відносно кількості доступних даних, тому оцінка виграє від "байєсівського скорочення"). Інакше MLE / bootstrap є достатнім.
Євгеній

Я думаю, що іншим можливим підходом є використання моделей зі змішаними ефектами (наприклад, використання пакету R lme4) для моделювання ієрархічної структури, на яку ви припускалися. Це також допоможе стабілізувати оцінки для (ієрархічних) моделей з великою кількістю параметрів.
Євгеній

1
Аналіз завантаження може дуже добре розглядатися як байєсівський аналіз, тому ваше питання майже так само може бути "Коли використовувати завантажувальний треп проти іншої байєсівської моделі" (Ваше запитання спонукало мене написати цю інтерпретацію завантажувальної машини як байєсівську модель : sumsar.net/blog/2015/04/… ). З огляду на питання, я погоджуюся з @Yevgeny, що нам, мабуть, потрібна додаткова інформація щодо вашої конкретної проблеми, перш ніж ми зможемо рекомендувати модель.
Rasmus Bååth,

Відповіді:


15

На мій погляд, ваш опис проблеми вказує на дві основні проблеми. Перший:

У мене досить складний аналіз рішень ...

Якщо припустити, що у вас є функція збитку , вам потрібно визначитися, чи турбуєтесь ви про ризик частотистів чи передбачувану втрату . Завантажувальний інструмент дозволяє наблизити функціонали розподілу даних, тому це допоможе в першому; і задні зразки MCMC дозволять оцінити останні. Але ...

У мене також є дані на підсистемі та системному рівні

тому ці дані мають ієрархічну структуру. Байєсівський підхід моделює такі дані дуже природно, тоді як початковий завантажувач спочатку був розроблений для даних, модельованих як iid. Поки він поширювався на ієрархічні дані (див. Посилання у введенні цієї статті ), такі підходи є відносно недорозвиненими (згідно реферату ця стаття ).

Підводячи підсумок: якщо це дійсно часті ризики, які вас хвилюють, то можуть знадобитися деякі оригінальні дослідження в застосуванні завантажувальної програми до теорії рішень. Однак, якщо мінімізація задніх очікуваних втрат є більш природним пристосуванням до вашої проблеми з рішенням, Байєс - це безумовно шлях.


Дякую, я не натрапив на жодне з цих; остання стаття видається особливо цікавою.
Aengus

5

Я читав, що непараметричний завантажувальний механізм може розглядатися як особливий випадок байєсівської моделі з дискретним (дуже) неінформативним попереднім, де припущення, що робляться в моделі, полягають у тому, що дані дискретні, а область домену ваш цільовий розподіл повністю спостерігається у вашій вибірці.

Ось дві довідки:

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.