Що таке / є неявними пріоритетами у частотистській статистиці?


20

Я чув почуття, що Джейнес стверджує, що лікарі-оператори працюють з "неявним попереднім".

Що це або є ці неявні пріори? Чи означає це, що періодичні моделі - це все особливі випадки байєсівських моделей, які чекають їх пошуку?


Прихований попередній перехід є виродженим розподілом, яке ставить усю масу ймовірності на , параметр, який байєсівський частоліст намагається оцінити. θ
Діліп Сарват

3
Наскільки я знаю, не існує ні частофілістської, ні байесівської моделі, є просто моделі та різні підходи до них.
Андрій Колядін

3
@DilipSarwate: Я не згоден з цим твердженням. Використання маси Дірака як попереднього не викликає процедур частотизму. А байєсівська парадигма не допускає пріорів з невідомими параметрами, за винятком випадків, коли встановлюється інший попередній показник для цих параметрів.
Сіань

2
Завжди є пріоритет, незважаючи ні на що. На жаль, для всіх статистичних процедур потрібна спеціальна відправна точка, яка робить їх дуже довільними. Хороша річ, що вам достатньо даних та правильної методології, ви наближаєтесь до пункту призначення. Погано в тому, як далеко ви дістаєтесь до пункту призначення, залежить від того, з чого ви починаєте і скільки даних у вас є.
Cagdas Ozgenc

2
@Cagdas Ozgenc: Ні, припущення завжди є , але вони не повинні приймати форму попередніх розподілів.
kjetil b halvorsen

Відповіді:


17

У теорії частотних рішень існують повні результати класу, які характеризують допустимі процедури як процедури Байєса або як обмеження процедур Байєса. Наприклад, необхідна і достатня умова Штейна (Stein. 1955; Farrell, 1968b) стверджує, що за наступними припущеннями

  1. щільність вибірки безперервна в і суворо позитивна на ; іf(x|θ)θΘ
  2. функція втрати суворо опукла, безперервна, і якщо компактна,LEΘ
    limδ+infθEL(θ,δ)=+.

оцінювач допустимий, якщо і тільки тоді вони існуютьδ

  • послідовність збільшення компактних наборів, така що ,(Fn)Θ=nFn
  • послідовність кінцевих заходів з підтримкою і(πn)Fn
  • послідовність оцінювачів Байєса, пов'язана з така, що(δn)πn

    1. існує компактний набір така, щоE0Θinfnπn(E0)1
    2. якщо компактна,EΘsupnπn(E)<+
    3. limnr(πn,δ)r(πn)=0 і
    4. limnR(θ,δn)=R(θ,δ) .

[відтворено з моєї книги, Байєсівський вибір , теорема 8.3.0, с.407]

У цьому обмеженому розумінні частофілістська властивість прийнятності наділяється байєсівським фоном, отже, асоціюється неявна попередня (або її послідовність) з кожним допустимим оцінювачем.

Sidenote: За сумним збігом обставин Чарльз Штейн помер 25 листопада в Пало-Альто, Каліфорнія. Йому було 96 років.

Існує аналогічний (якщо математично залучений) результат для інваріантної або еквівалентної оцінки, а саме, що найкращий еквівалентний оцінювач - це оцінка Байєса для кожної перехідної групи, що діє за статистичною моделлю, пов'язаної з правою мірою Хаара, , індукованою на за цією групою та відповідні інваріантні втрати. Докладні відомості див. У Пітмена (1939), Штейна (1964) або Зідека (1969). Це, швидше за все, мав на увазі Джейнс , коли він насильно сперечався щодо вирішення парадоксів маргіналізації за принципами інваріантності .πΘ

Крім того, як детально описано у відповіді цивільногостату, до байєвських процедур також пов'язане ще одне частофілістське поняття оптимальності, а саме мінімаксичність, оскільки процедура minimax, що мінімізує максимальну помилку (над простором параметрів), часто є процедурою maximin, яка максимально збільшує мінімальну помилку ( за всіма попередніми розподілами), отже, це процедура Байєса або межа Байєса.

Питання: Чи є грізний винос, який я можу використовувати, щоб передати свою байєсівську інтуїцію частолістським моделям?

По-перше, я б уникнув використання терміна "частостська модель", оскільки існують моделі вибірки (дані - реалізація для значення параметра )xXf(x|θ)θ та частофілістські процедури (найкращий об'єктивний оцінювач, мінімум інтервал довірчої дисперсії та т.п.)По-друге, я не бачу переконливої ​​методологічної чи теоретичної причини розглядати частолістські методи як прикордонні чи обмежуючі байєсівські методи. Виправданням процедури частості, коли вона існує, є задоволення деякої властивості оптимальності в просторі вибірки, тобто при повторенні спостережень. Основне обгрунтування процедур Байєса полягає в тому, щоб бути оптимальним [за певним критерієм або функцією втрат] за умови попереднього розподілу та однієї реалізації з вибіркової моделі. Іноді отримана процедура задовольняє деяку частофілістську властивість ( % достовірний регіон - це % довіри)9595 , але це буває так, що ця оптимальність не переноситься на всі процедури, пов'язані з байєсівською моделлю.


1
Дуже дякую. Як початківець, чи є ярусний випадок, який я можу використати, щоб передати свою байєсівську інтуїцію частолістським моделям? тобто (цей GLM схожий на x з y до, або це ласо схоже на байєсівський ксиз).
Bayesquest

1
Крім того, ви не хотіли б поглянути на інше моє запитання тут: stats.stackexchange.com/questions/247850/… Я знаю, що ви запропонували деякі рішення проблеми байесівської крихкості ... але я відчуваю, що рішення не є надійними. або легко володіти соціальним вченим.
Bayesquest

1
Для першого коментаря ось кілька прикладів того, про що я говорив: - Нейронні мережі та лікарі загальної практики - stats.stackexchange.com/questions/71782/… - sumsar.net/blog/2015/04/… - [непараметричний байесів (npB) pointof-view дозволяє інтерпретувати ліси як зразок із задньої частини дерев] ( arxiv.org/pdf/1502.02312.pdf )
Bayesquest

Ми працювали над приблизним байєсівським висновком із випадковими лісами і виявили, що мінливість, що виникає в результаті цього інструменту, досить не пов'язана з початковою задньою. Звичайно, це не означає, що воно не дозволяє байєсівської інтерпретації, але все-таки ...
Сіань

12

@ Відповідь Сіаня є більш повною. Але оскільки ви також попросили витягнути жалюзі, ось такий. (Концепції, про які я згадую, не точно збігаються з налаштуваннями допустимості вище.)

Часто (але не завжди) люблять використовувати оцінки, що є "мінімакс": якщо я хочу оцінити , мій ризик мого оцінювача повинен бути кращим, ніж будь-який інший ризик будь-якого іншого оцінювача . Виявляється, MLE часто (приблизно) мінімакс. Деталі див. Тут або тут .θθ^

Для того, щоб знайти оцінювач minimax для проблеми, один із способів - це на мить подумати Байесіана і знайти "найменш сприятливий попередній" . Це попередник, чий оцінювач Байєса має більш високий середній ризик, ніж будь-який інший попередній оцінювач Байєса. Якщо ви можете його знайти, то виявляється, що оцінювач Bayes є мінімаксом.ππ

У цьому сенсі ви можете з жалем сказати: A (використовуючи мінімакс) Частознавець - це як баєс, який вибрав (базується на оцінці) найменш сприятливий раніше.

Можливо, ви можете розтягнути це, щоб сказати: Такий Частота є консервативним баєсом, обираючи не суб'єктивних пріорів чи навіть неінформативних пріорів, а (у цьому конкретному розумінні) найгірших пріорів.

Нарешті, як говорили інші, розтягнути таким чином часто і байєсів слід розтягнутись. Бути частою практикою не означає, що ви використовуєте певний оцінювач. Це просто означає, що ви задаєте питання щодо властивостей вибірки вашого оцінювача, тоді як ці питання не є основним пріоритетом Байесія. (Отже, будь-який байєсів, який сподівається на хороші властивості вибірки, наприклад, "калібрований Байєс" , також є частою практикою.)
Навіть якщо ви визначаєте частотиста як того, чиї оцінки завжди мають оптимальні властивості вибірки, таких властивостей багато, і ви не завжди можете зустріти їх усіх одразу. Тож важко говорити загалом про "всі моделі частот".


4
Я думав, що неявний попередній час для періодичного аналізу буде попереднім.
Майкл Р. Черник

5
Буває, іноді. Ви можете подумати про MLE як оцінку MAP, використовуючи єдиний попередній. Але MLE - не єдиний інструмент, який часто використовують лікарі.
цивільний стан

Інша пов’язана концепція: "відповідні пріори" або "пріори відповідності ймовірності", конкретні пріори, розроблені вашим достовірним інтервалом приблизно відповідають частотному інтервалі довіри для цього конкретного параметра. Знову ж таки, вони можуть бути рівномірними, але не повинні бути. Залежить від вибору параметра і від того, наскільки хорошим ви хочете наближення. Дивіться, наприклад, utstat.utoronto.ca/reid/research/vaneeden.pdf1α1α
civilstat
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.