Поєднання інформації з декількох досліджень для оцінки середнього рівня та дисперсії нормально розподілених даних - байєсівський та метааналітичний підходи


21

Я розглянув набір робіт, кожен з яких повідомляє про спостережуване середнє значення та SD про вимірювання у відповідному зразку відомого розміру, . Я хочу зробити найкращу здогадку про ймовірний розподіл тієї ж міри в новому дослідженні, яке я розробляю, і наскільки невизначеність у цій здогадці. Я радий вважати ).ХнХN(мк,σ2

Першою моєю думкою був метааналіз, але зазвичай використовувані моделі зосереджуються на точкових оцінках та відповідних інтервалах довіри. Однак я хочу сказати щось про повний розподіл , який у цьому випадку також включав би здогадку про дисперсію . Хσ2

Я читав про можливі підходи Баєйсана до оцінки повного набору параметрів заданого розподілу з урахуванням попередніх знань. Це, як правило, має більше сенсу для мене, але я маю нульовий досвід байєсівського аналізу. Це також здається простою, порівняно простою проблемою вирізати зуби.

1) Враховуючи мою проблему, який підхід має найбільш сенс і чому? Метааналіз чи байєсівський підхід?

2) Якщо ви вважаєте, що байєсівський підхід найкращий, можете вказати мені на спосіб здійснення цього (бажано в R)?

Супутнє питання

ЗМІНИ:

Я намагався розібратися в тому, що, на мою думку, є «простим» байєсівським способом.

Як я вже говорив вище, мене цікавлять не лише оцінене середнє значення , але й дисперсія , з огляду на попередню інформацію, тобтомкσ2П(мк,σ2|Y)

Знову ж таки, я нічого не знаю про байєанізм на практиці, але не знадобилося багато часу, щоб виявити, що задній частині нормального розподілу з невідомими середніми і дисперсійними розв'язками має рішення закритої форми через кон'югацію з нормальним-зворотним гамма-розподілом.

Задача формулюється як .П(мк,σ2|Y)=П(мк|σ2,Y)П(σ2|Y)

П(мк|σ2,Y) оцінюється при нормальному розподілі; з оберненим гамма-розподілом.П(σ2|Y)

Мені знадобилося певний час, щоб обернутись головою, але з цих посилань ( 1 , 2 ) я зміг, я думаю, розібратися, як це зробити в Р.

Я почав з кадру даних, складеного з рядка для кожного з 33 досліджень / зразків, та стовпців для середнього, дисперсії та розміру вибірки. Я використовував середню, дисперсію та розмір вибірки з першого дослідження, у рядку 1, як свою попередню інформацію. Потім я оновив це інформацією з наступного дослідження, обчислив відповідні параметри та відібрав вибірку з нормально-зворотної гами, щоб отримати розподіл та . Це повторюється, поки не будуть включені всі 33 дослідження.мкσ2

# Loop start values values

  i <- 2
  k <- 1

# Results go here

  muL      <- list()  # mean of the estimated mean distribution
  varL     <- list()  # variance of the estimated mean distribution
  nL       <- list()  # sample size
  eVarL    <- list()  # mean of the estimated variance distribution
  distL    <- list()  # sampling 10k times from the mean and variance distributions

# Priors, taken from the study in row 1 of the data frame

  muPrior  <- bayesDf[1, 14]    # Starting mean
  nPrior   <- bayesDf[1, 10]    # Starting sample size
  varPrior <- bayesDf[1, 16]^2  # Starting variance

  for (i in 2:nrow(bayesDf)){

# "New" Data, Sufficient Statistics needed for parameter estimation

    muSamp    <- bayesDf[i, 14]          # mean
    nSamp     <- bayesDf[i, 10]          # sample size
    sumSqSamp <- bayesDf[i, 16]^2*(nSamp-1)  # sum of squares (variance * (n-1))

# Posteriors

    nPost   <- nPrior + nSamp
    muPost  <- (nPrior * muPrior + nSamp * muSamp) / (nPost)  
    sPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               ((nPrior * nSamp) / (nPost)) * ((muSamp - muPrior)^2)
    varPost <- sPost/nPost
    bPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               (nPrior * nSamp /  (nPost)) * ((muPrior - muSamp)^2)
# Update 

    muPrior   <- muPost
    nPrior    <- nPost
    varPrior  <- varPost

# Store

    muL[[i]]   <-  muPost
    varL[[i]]  <-  varPost
    nL[[i]]    <-  nPost
    eVarL[[i]] <- (bPost/2) / ((nPost/2) - 1)

# Sample

    muDistL  <- list()  
    varDistL <- list()

    for (j in 1:10000){
      varDistL[[j]] <- 1/rgamma(1, nPost/2, bPost/2)
      v             <- 1/rgamma(1, nPost/2, bPost/2)
      muDistL[[j]]  <- rnorm(1, muPost, v/nPost)
    }

# Store 

    varDist    <- do.call(rbind, varDistL)
    muDist     <- do.call(rbind, muDistL)
    dist       <- as.data.frame(cbind(varDist, muDist))
    distL[[k]] <- dist

# Advance

    k <- k+1 
    i <- i+1

  }

  var     <- do.call(rbind, varL)
  mu      <- do.call(rbind, muL)
  n       <- do.call(rbind, nL)
  eVar    <- do.call(rbind, eVarL)
  normsDf <- as.data.frame(cbind(mu, var, eVar, n)) 
  colnames(seDf) <- c("mu", "var", "evar", "n")
  normsDf$order <- c(1:33)

Ось діаграма шляху, що показує, як змінюються та додаючи кожен новий зразок.Е(мк)Е(σ2)

введіть тут опис зображення

Ось десенції, засновані на вибірці з розрахункових розподілів для середнього та відхилення при кожному оновленні.

введіть тут опис зображення

введіть тут опис зображення

Я просто хотів додати це на випадок, якщо це корисно для когось іншого, і щоб люди, які знають, могли сказати мені, чи було це розумно, хибно тощо.

Відповіді:


11

Два підходи (метааналіз та байєсівське оновлення) насправді не є такими відмінними. Метааналітичні моделі насправді часто називають баєсівськими моделями, оскільки ідея додавання доказів до попередніх знань (можливо, досить розпливчастих) про це явище, природно, піддається метааналізу. Стаття, яка описує це з'єднання:

Brannick, MT (2001). Наслідки емпіричного метааналізу Байєса для валідації тесту. Журнал прикладної психології, 86 (3) , 468-480.

(автор використовує кореляції як міру результату для мета-аналізу, але принцип однаковий незалежно від міри).

Більш загальною статтею про байєсівські методи мета-аналізу буде:

Sutton, AJ, & Abrams, KR (2001). Баєсові методи в метааналізі та синтезі доказів. Статистичні методи в медичних дослідженнях, 10 (4) , 277-303.

Те, що вам здається після (крім деякої комбінованої оцінки) - це інтервал прогнозування / достовірності, який описує, де в майбутньому дослідженні може впасти справжній результат / ефект. Такий інтервал можна отримати з "традиційного" метааналізу або з баєсової метааналітичної моделі. Традиційний підхід описаний, наприклад, у:

Райлі, RD, Хіггінс, JP та Дікс, JJ (2011). Інтерпретація метааналіз випадкових ефектів. Британський медичний журнал, 342 , d549.

θiθiiθi


3
На додаток до цього, багато результатів баєсів було зроблено з результатів метааналізу.
Фоміт

2

уijN(мк,σ2)i=1,...нjj=1,...,Кмк

мк^=1Nj=1Кнjу¯j,N=j=1Кнj.
σσ2
σ~2=1N-Кj=1К(нj-1)сj2
NК
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.