Проблема
Я пишу функцію R, яка виконує байєсівський аналіз, щоб оцінити задню щільність за даними попередніх даних та даних. Я хотів би, щоб функція надсилала попередження, якщо користувачеві потрібно переглянути попереднє.
У цьому питанні мені цікаво дізнатися, як оцінити попереднє. Попередні питання висвітлювали механіку викладу інформованих пріорів ( тут і тут ).
Наступні випадки можуть вимагати повторної оцінки:
- дані являють собою крайній випадок, який не враховувався при заявленні попереднього
- помилки в даних (наприклад, якщо дані є в одиницях g, коли попереднє значення є в кг)
- неправильний пріоритет був вибраний з набору доступних пріорів через помилку в коді
У першому випадку пріори зазвичай досить розсіяні, що дані, як правило, переповнюють їх, якщо значення даних не лежать у непідтримуваному діапазоні (наприклад, <0 для logN чи Gamma). Інші випадки - помилки чи помилки.
Запитання
- Чи є якісь питання щодо обґрунтованості використання даних для оцінки попереднього?
- який-небудь тест найкраще підходить для цієї проблеми?
Приклади
Ось два набори даних, які погано узгоджуються з раніше, оскільки вони є з популяцій або з (червоний), або з (синій).
Сині дані можуть бути дійсною комбінацією даних попереднього +, тоді як для червоних даних потрібен попередній розподіл, який підтримується для негативних значень.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')