Плоскі, кон'юговані та гіперприори. Хто вони?


15

В даний час я читаю про Байєсові методи в обчислювальній молекулярній еволюції Ян. У розділі 5.2 мова йде про пріори, зокрема про неінформативні / плоскі / розпливчасті / дифузні, сполучені та гіперприори.

Це може бути запитання про надмірне спрощення, але чи може хтось просто пояснити різницю між цими видами пріорів та як це впливає на результат аналізу / рішень, які я приймав би під час байєсівського аналізу?

(Я не статистик, і я тільки починаю на шляху до вивчення байєсівських аналізів, тому чим більше це в простому плані, тим краще)

Відповіді:


15

Простіше кажучи, плоский / неінформативний пріоритет застосовується, коли людина мало знає про дані і, отже, має найменший вплив на результати вашого аналізу (тобто задній висновок).

Кон'югатні розподіли - це ті, у кого попередній і задній розподіли однакові, а попередній називається кон'югатом пріорі. Її віддають перевагу його алгебраїчні зручності , особливо коли ймовірність має поширення у вигляді експоненціальної родини (Гауссана, Бета та ін.). Це надзвичайно вигідно при проведенні заднього моделювання за допомогою відбору проб Гіббса.

І нарешті уявіть, що попередній розподіл встановлюється для параметра у вашій моделі, однак ви хочете додати ще один рівень складності / невизначеності. Тоді ви накладете попередній розподіл на параметри вищезгаданого попереднього, звідси і назва гіпер- пріор.

Я думаю, що Bayesian аналіз даних Гельмана - це чудовий початок для тих, хто зацікавлений у вивченні байєсівської статистики :)


1
По-друге, затвердження Байєсового аналізу даних.
Sycorax каже, що повернеться Моніка

14

На найвищому рівні ми можемо вважати всі види пріоритетів як конкретизацію деякої кількості інформації, яку дослідник несе в аналізі поза самими даними: перед тим, як переглянути дані, які значення параметрів є більш імовірними?

У темну епоху байєсівського аналізу, коли байєси боролися з нею із часто відвідувачами лікарів, існувало повір'я, що дослідник захоче внести якомога менше інформації до аналізу за допомогою попереднього, наскільки це можливо. Таким чином, було багато досліджень і аргументів, присвячених розумінню того, як саме, пріоритет може бути "неінформативним" таким чином. Сьогодні Гельман заперечує проти автоматичного вибору неінформативних пріорів, говорячи в Байєсівському аналізі данихщо опис "неінформативний" відображає його ставлення до попередніх, а не до будь-яких "спеціальних" математичних особливостей попереднього. (Більше того, в ранній літературі виникало питання про те, в якому масштабі пріоритет є неінформативним. Я не думаю, що це особливо важливо для вашого питання, але для хорошого прикладу цього аргументу з точки зору частолюдистів див. Початок Гері Кінга, Об'єднавча політична методологія. )

"Плоский" пріоритет вказує на рівномірний попередній, коли всі значення в діапазоні однаково вірогідні. Знову ж таки, існують аргументи щодо того, чи є вони справді неінформативними, оскільки уточнення того, що всі значення однаково ймовірні, певним чином є інформацією та може бути чутливим до того, як параметризована модель. Плоскі приори мають давню історію байєсівського аналізу, тягнеться назад до Байєса і Лапласа.

"Неясний" пріоритет є сильно розсіяним, хоча й не обов'язково рівним, і він виражає, що великий діапазон значень правдоподібний, а не концентрування маси ймовірностей навколо конкретного діапазону. По суті, це пріоритет з великою дисперсією (що б "висока" дисперсія не означає у вашому контексті).

Сполучені пріори мають зручну особливість, що, множившись на відповідну ймовірність, вони створюють вираз закритої форми. Одним із прикладів цього є бета-версія, що має вірогідність бінома, або гамма до імовірності пуассону. У цьому Інтернеті та Вікіпедії є корисні таблиці. Експоненціальна сім'я надзвичайно зручна в цьому плані.

Кон'югатні пріори часто є вибором "за замовчуванням" для деяких проблем через їх зручні властивості, але це не обов'язково означає, що вони є "найкращими", якщо попередні знання не можуть бути висловлені через кон'югат попереднього. Успіх обчислень означає, що кон'югація не така цінна, як колись (див. Вибірку Гіббса проти NUTS), тому ми можемо легше виконувати умовивід з некон'югатними пріорами без особливих проблем.

N(мк,σ2)мкσ2мкσ2


1
Крім того, іноді незрозуміло, що таке "дані" та що таке "попередня інформація", подивіться на приклад мою відповідь на stats.stackexchange.com/questions/112451/… .
kjetil b halvorsen
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.