Вибір пріорів на основі похибки вимірювання


9

Як обчислити відповідний попередній час, якщо у вас є помилка вимірювання приладу? Цей параграф є з книги Крессі "Статистика просторово-часових даних":

Часто трапляється, що є якась попередня інформація щодо дисперсії помилок вимірювань, що дозволяє задавати досить інформативну модель параметрів. Наприклад, якщо ми припускаємо умовно незалежні помилки вимірювання, які є iid , то нам слід вказати інформаційний попередній для . Скажімо , ми були зацікавлені в температурі навколишнього повітря, і ми побачили , що специфікації виробника приладу вказані «помилка» в ± 0,1 ° C . Якщо припустити, що ця "помилка" відповідає двом стандартним відхиленням (припущення, яке слід перевірити!), То ми можемо вказати \ sigma _ {\ epsilon} ^ {2}, щоб мати попереднє середнє значення (0,1 / 2) ^ 2 = 0,0025Gau(0,σϵ2)σϵ2±0.1°Cσϵ2(0.1/2)2=0.0025. Через специфікацію виробника приладу ми б припустили розподіл, який мав чітко визначений і досить вузький пік при 0,0025 (наприклад, зворотна гамма). Насправді ми могли просто зафіксувати 0,0025; однак помилка моделі даних може мати і інші компоненти невизначеності (Розділ 7.1). Щоб уникнути можливих проблем з ідентифікацією з помилками моделей процесів, дуже важливо, щоб модельєри зменшили невизначеність настільки, наскільки дозволяє наука, включаючи проведення побічних досліджень, призначених для копіювання даних.

Хтось знає, яка загальна процедура отримання значень попереднього, як описано вище (хоча параграф стосується лише отримання попереднього середнього)?

Відповіді:


6

Два стандартні методи є

  1. Зверніться до "технічних характеристик виробника приладів", як зазначено у пропозиції. Зазвичай це сирий відкат, який слід використовувати, коли іншої інформації немає, тому що (а) те, що виробник приладів насправді означає "точність" та "точність", часто не визначається та (б) як інструмент реагував, коли новий в тестова лабораторія була, ймовірно, набагато кращою, ніж вона використовується при використанні в польових умовах.

  2. Збір повторних зразків. У вибірці навколишнього середовища існує близько півдесятка рівнів, на яких зразки регулярно копіюються (і ще багато інших, на яких їх можна було б повторити), причому кожен рівень використовується для контролю джерела зміни, що може бути віднесеним. Такі джерела можуть включати:

    • Посвідчення особи, яка бере пробу.
    • Попередні процедури, такі як забір свердловин, взяті перед отриманням проби.
    • Змінність у процесі фізичної вибірки.
    • Гетерогенність в межах самого обсягу вибірки.
    • Зміни, які можуть статися при збереженні та доставці зразка в лабораторію.
    • Варіації попередніх лабораторних процедур, такі як гомогенізація фізичного зразка або переварювання його для аналізу.
    • Ідентифікація лабораторних аналітиків.
    • Відмінності між лабораторіями.
    • Відмінності між фізично різними інструментами, такими як два газових хроматографа.
    • Збіг у калібруванні приладу з часом.
    • Добова варіація. (Це може бути природним та систематичним, але може виявлятися випадковим, коли час вибірки є довільним.)

Повну кількісну оцінку компонентів мінливості можна отримати лише систематично змінюючи кожен із цих факторів відповідно до відповідної експериментальної конструкції.

Зазвичай вивчаються лише джерела, які, як вважається, сприяють найбільшій мінливості. Наприклад, багато досліджень систематично розбивають певну частину зразків після їх отримання та доставляють їх до двох різних лабораторій. Вивчення відмінностей між результатами цих розщеплень може кількісно оцінити їх внесок у мінливість вимірювання. Якщо отримано достатньо таких розщеплень, повний розподіл мінливості вимірювання можна оцінити як попередній в ієрархічній байєсівській просторово-часовій моделі. Оскільки багато моделей, припускаючи розподіли Гаусса (для кожного обчислення), отримання Гауссового попереднього зрештою зводиться до оцінки середнього та відмінності відмінностей між розщепленнями. У більш складних дослідженнях, які мають на меті виявити більш ніж один компонент дисперсії,

Однією з переваг навіть думати над цими питаннями є те, що вони допомагають вам визначити способи зменшити або навіть усунути деякі з цих компонентів помилок (без того, щоб коли-небудь їх оцінювати), тим самим наблизившись до ідеалу Cressie & Wikle "зменшити невизначеність стільки, скільки дозволяє наука ".

Для розширеного відпрацьованого прикладу (у відборі ґрунтів) див

Ван Е, Блюм і Старкс, обґрунтування оцінки помилок у відборі ґрунтів. США EPA, травень 1990: EPA / 600 / 4-90 / 013.


2
Проблема, Роберт, полягає в тому, що іноді хтось повідомляє про стандартне відхилення оцінки; в інший час вони повідомлять про це двічі (звідки поділ на два) або двосторонній довірчий інтервал; а іноді навіть щось інше; тому не існує певного правила перетворення тверджень про точність та точність у пріори: ви повинні ознайомитися зі виносками та іншими технічними деталями, щоб з’ясувати, що саме представляють цифри. Стандартна помилка оцінки, яка є функцією від розміру використовуваного зразка, для цієї мети не має значення.
whuber

1
Зрозумів. Дозвольте мені змінити фокус на ваш другий випадок. Якщо я повторюю експеримент пару разів і вимірювання та , як я можу використовувати цю інформацію для інформування середнього та відхилення для попереднього розподілу? Ви запропонували щось на зразок для декількох розкол, правда? Тому я мав би середню помилку вимірювання та вибіркове стандартне відхилення . Чи достатньо цього, щоб включити його до попереднього ? m1m2m1m2mϵσϵN(mϵ,σϵ2)
Роберт Сміт

1
Ви не можете оцінити точність за допомогою розщеплення: для цього вам потрібно виміряти вибірки відомих значень. (Для цього використовуються лабораторні шипи та дублюючі дублікати .) Це визначатиме середнє значення. Зазвичай це обробляється при калібруванні процесу вимірювання, тому середнє значення приймається рівним нулю. Відхилення оцінюють за звичайними формулами ANOVA. Ви можете використовувати це, щоб вказати пріоритет на відповідний компонент вимірювальної системи.
whuber

2
Не так: Посилання, яке я дав, - це вказівки щодо EPA в США, які існують вже чверть століття, і багато останніх настанов ґрунтуються на його ідеях. Я колись використовував цей підхід у справі федерального суду, щоб оцінити вплив похибки вимірювання на контурних лініях (на основі геостатистичного прогноктора), щоб окреслити забруднюючий шлейф: похибка вимірювання була більшою, ніж концентрація, що використовується для обмеження шлейфу! (Іншими словами, невизначеність у розмежуванні шлейфу була по суті нескінченною.)
whuber

1
Дійсно приємно. До речі, я мав на увазі сказати, що пріори зазвичай встановлюються без особливої ​​обережності. Я це бачив більш помітно в байєсівському моделюванні та машинному навчанні, можливо, тому, що здогадок часто достатній для отримання гідних результатів.
Роберт Сміт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.