Як можна формалізувати попередній розподіл ймовірностей? Чи є правила, які слід використовувати?


9

Хоча мені подобається думати, що я добре розумію концепцію попередньої інформації в байєсівському статистичному аналізі та прийнятті рішень, у мене часто виникають проблеми з обгортанням голови навколо її застосування. Я маю на увазі пару ситуацій, які є прикладом моєї боротьби, і я вважаю, що вони не належним чином розглядаються в байєсівських підручниках статистики, які я читав до цього часу:

Скажімо, я провів опитування кілька років тому, в якому сказано, що 68% людей були б зацікавлені у придбанні продукту ACME. Я вирішую запустити опитування ще раз. Хоча я використовую той самий розмір вибірки, що і минулого разу (скажімо, n = 400), думки людей, мабуть, змінилися відтоді. Однак якщо я використовую в якості попереднього бета-розподілу, в якому 272 з 400 респондентів відповіли "так", я б надавав однакову вагу опитуванню, яке я провів кілька років тому, і тому, за яким я б зараз працював. Чи є правило, щоб встановити більшу невизначеність, яку я хотів би зробити на попередньому в силу того, що дані мають кілька років? Я розумію, що я можу просто скоротити попереднє значення з 272/400 до, скажімо, 136/200, але це відчувається вкрай умовно, і мені цікаво, чи є якась форма виправдання, можливо, в літературі,

Для іншого прикладу, скажімо, ми збираємося провести клінічне випробування. Перш ніж розпочати випробування, ми проводимо деякі вторинні дослідження, які ми могли б використати як попередню інформацію, включаючи думки експертів, результати попередніх клінічних випробувань (різної актуальності), інші основні наукові факти тощо. Як рухатись щодо комбінування цього спектра інформації (деякі з яких не мають кількісного характеру) до попереднього розподілу ймовірностей? Це лише випадок прийняття рішення про те, яку сім’ю вибрати та зробити її досить розсіяною, щоб переконатись, що вона перевантажена даними, чи зроблено багато роботи, щоб встановити досить інформативний попередній розподіл?


Відповіді:


4

Ваша ідея розглянути попередню інформацію про 272 успіхи в 400 спробах має досить солідне байєсівське обгрунтування.

Як ви визнали, проблема, з якою ви маєте справу, полягає в оцінці ймовірності успіху експерименту Бернуллі. Розподіл Beta є відповідним "попереднім кон'югатом". Такі споріднені пріори користуються "вигаданою вибірковою інтерпретацією":θ

Попередньою бета є Це можна інтерпретувати як інформацію, що міститься у вибірці розміру (вільно, тому що не повинно бути цілим числом звичайно ) з успіхами: Отже, якщо взяти і , це відповідає попереднім параметрам і

π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)β01
n_=α0+β02n_α01
π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)n_(α01)
α0+β02=400α01=272α0=273β0=129. "Половина" вибірки призведе до попередніх параметрів і . Тепер згадаймо, що попереднє середнє значення та попередня дисперсія бета-розподілу задаються Половина вибірки зберігає попереднє середнє значення (майже) там, де воно:α0=137β0=65
μ=αα+βandσ2=αβ(α+β)2(α+β+1)
alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

але збільшує попередню дисперсію від

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

до

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

за бажанням.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.