Це слід легко вирішити, використовуючи байєсівські умовиводи. Ви знаєте вимірювальні властивості окремих точок відносно їх справжнього значення і хочете зробити висновок про середнє значення сукупності та SD, що генерувало справжні значення. Це ієрархічна модель.
Перефразування проблеми (основи Байєса)
Зауважте, що тоді як ортодоксальна статистика дає вам єдине середнє значення, в байесівських рамках ви отримуєте розподіл достовірних значень середнього. Наприклад, спостереження (1, 2, 3) із SD (2, 2, 3) могли бути сформовані за максимальною оцінкою ймовірності 2, але також у середньому 2,1 або 1,8, хоча дещо рідше (за даними) ПЛЮС. Отже, крім SD, ми також підводимо середнє значення .
Ще одна концептуальна відмінність полягає в тому, що ви повинні визначити свій рівень знань, перш ніж робити спостереження. Ми називаємо це пріорами . Ви можете заздалегідь знати, що певна ділянка була відсканована і в певному діапазоні висоти. Повна відсутність знань полягала б у тому, щоб мати рівномірний (-90, 90) градусів як попередній у X та Y, а може бути і рівномірний (0, 10000) метрів по висоті (над океаном, під найвищою точкою на землі). Ви повинні визначити розподілення пріорів для всіх параметрів, які ви хочете оцінити, тобто отримати задні розподіли . Це справедливо і для стандартного відхилення.
Отже, перефразовуючи свою проблему, я припускаю, що ви хочете зробити висновок про достовірні значення для трьох засобів (X.mean, Y.mean, X.mean) та трьох стандартних відхилень (X.sd, Y.sd, X.sd), які можуть мати генерував ваші дані.
Модель
Використовуючи стандартний синтаксис BUGS (використовуйте WinBUGS, OpenBUGS, JAGS, stan або інші пакети для запуску цього), ваша модель виглядатиме приблизно так:
model {
# Set priors on population parameters
X.mean ~ dunif(-90, 90)
Y.mean ~ dunif(-90, 90)
Z.mean ~ dunif(0, 10000)
X.sd ~ dunif(0, 10) # use something with better properties, i.e. Jeffreys prior.
Y.sd ~ dunif(0, 10)
Z.sd ~ dunif(0, 100)
# Loop through data (or: set up plates)
# assuming observed(x, sd(x), y, sd(y) z, sd(z)) = d[i, 1:6]
for(i in 1:n.obs) {
# The true value was generated from population parameters
X[i] ~ dnorm(X.mean, X.sd^-2) #^-2 converts from SD to precision
Y[i] ~ dnorm(Y.mean, Y.sd^-2)
Z[i] ~ dnorm(Z.mean, Z.sd^-2)
# The observation was generated from the true value and a known measurement error
d[i, 1] ~ dnorm(X[i], d[i, 2]^-2) #^-2 converts from SD to precision
d[i, 3] ~ dnorm(Y[i], d[i, 4]^-2)
d[i, 5] ~ dnorm(Z[i], d[i, 6]^-2)
}
}
Природно, ви стежите за параметрами .mean і .sd і використовуєте їх афіші для висновку.
Моделювання
Я імітував такі дані, як:
# Simulate 500 data points
x = rnorm(500, -10, 5) # mean -10, sd 5
y = rnorm(500, 20, 5) # mean 20, sd 4
z = rnorm(500, 2000, 10) # mean 2000, sd 10
d = cbind(x, 0.1, y, 0.1, z, 3) # added constant measurement errors of 0.1 deg, 0.1 deg and 3 meters
n.obs = dim(d)[1]
Потім запустили модель, використовуючи JAGS для 2000 ітерацій після спалаху 500 ітерацій. Ось результат для X.sd.
Синій діапазон вказує на 95% найвищої задньої щільності або достовірного інтервалу (де ви вважаєте, що параметр є після спостереження за даними. Зауважте, що православний інтервал довіри вам цього не дає).
Червона вертикальна лінія є оцінкою MLE для вихідних даних. Зазвичай так буває, що найвірогідніший параметр за байєсівською оцінкою - це також найбільш вірогідний (максимальна ймовірність) параметр в ортодоксальній статистиці. Але вам не слід надто піклуватися про верхню частину задньої частини. Середнє значення або медіана краще, якщо ви хочете звести їх до єдиного числа.
Зауважте, що MLE / top не на 5, тому що дані були генеровані випадковим чином, а не через неправильну статистику.
Обмеження
Це проста модель, яка наразі має кілька вад.
- Він не обробляє ідентичність -90 і 90 градусів. Це, однак, можна зробити, зробивши деяку проміжну змінну, яка зміщує крайні значення оцінюваних параметрів у діапазон (-90, 90).
- X, Y і Z в даний час моделюються як незалежні, хоча вони, ймовірно, співвідносяться, і це слід враховувати, щоб отримати максимальну користь від даних. Це залежить від того, рухався вимірювальний пристрій (послідовна кореляція та спільний розподіл X, Y і Z дасть вам багато інформації) чи стоять нерухомо (незалежність в порядку). Я можу розширити відповідь, щоб підійти до цього, якщо вимагаю.
Я мушу зазначити, що є багато літератури про просторові байєсівські моделі, про які я не знаю.