Чи існує байєсівський підхід до оцінки щільності


22

Я зацікавлений , щоб оцінити щільність безперервної випадкової величини Х . Один із способів цього, який я дізнався, - це використання оцінки щільності ядра.

Але зараз мене цікавить байєсівський підхід, що йде в наступних напрямках. Спочатку я вважаю , що Х слід розподіл Ж . Я приймаю н свідчення Х . Чи є якийсь підхід до оновлення Ж заснований на моїх нових читаннях?

Я знаю, що це звучить так, що я суперечую собі: якщо я вірю виключно у як мій попередній розподіл, то жодні дані не повинні переконувати мене в іншому. Однак припустимо, що F були U n i f [ 0 , 1 ], і мої дані були такими, як ( 0,3 , 0,5 , 0,9 , 1,7 ) . Побачивши 1.7 , я, очевидно, не можу дотримуватися свого попереднього, але як слід оновити його?ЖЖUнif[0,1](0,3,0,5,0,9,1.7)1.7

Оновлення: На підставі пропозицій у коментарях я почав розглядати процес Діріхле. Дозвольте мені використовувати наступні позначення:

ГDП(α,Н)θi|ГГхi|θiN(θi,σ2)

Після постановки моєї оригінальної проблеми цією мовою, я думаю, мене цікавить таке: . Як це зробити?θн+1|х1,...,хн

У цьому наборі приміток (стор. 2) автор зробив приклад (Схема Поля Урни). Я не впевнений, чи це актуально.θn+1|θ1,...,θn

Оновлення 2: Я також хочу запитати (побачивши замітки): як люди обирають для DP? Це здається випадковим вибором. Крім того, як люди обирають попередній Н для DP? Чи повинен я просто використовувати пріоритет для θ як мій попередній для H ?αHθH


2
"Якщо я вірю виключно у F як попереднє розповсюдження, то жодні дані не повинні переконувати мене в іншому". Це антитеза байєсівського висновку, яка більше узгоджується з тим, що візьміть те, що ви вірите в одну руку, і світ в іншу, і зберіть їх разом і подивіться, що вийде. Вимийте, промийте, повторіть.
Олексій

Ви знаєте щось про процес диріхлету?
niandra82

Ігнорування останнього абзацу: є дві загальні варіанти цієї проблеми. Один - це кінцева суміш нормалей (ви можете вибрати, скільки нормалей, виходячи з вірогідності перехресної валідації), або нескінченна суміш нормалей, як пропонує @ niandra82. Це можна зробити з чимось на зразок вибірки Гіббса або варіативного висновку. Чи знайомі ви з будь-яким із цих методів?

Я також повинен запитати, як ви маєте намір використовувати цей KDE? Обраний метод та розмір (нескінченний, кінцевий) можуть залежати від вашої мети.

Це звучить як проблема вибору моделі, або філософська. Насправді, наш вибір, яку ймовірність використовувати у байесівському висновку, також нав'язує попередні вірування ...
Зоя Кларк

Відповіді:


2

Оскільки ви хочете байєсівський підхід, вам потрібно припустити деякі попередні знання про те, що ви хочете оцінити. Це буде у формі розподілу.

Тепер проблема полягає в тому, що це зараз розподіл по дистрибутивам. Однак це не є проблемою, якщо припустити, що кандидатські розподіли походять з якогось параметризованого класу розподілів.

Наприклад, якщо ви хочете припустити, що дані розподіляються з гауссом з невідомою середньою, але відомою дисперсією, то все, що вам потрібно, - це пріоритет над середнім.

Оцінка MAP невідомого параметра (називайте його ) може продовжуватися, припускаючи, що всі точки спостережень / даних умовно незалежні від даного невідомого параметра. Тоді, оцінка ПДЧ єθ

,θ^=argmaxθ(Pr[x1,x2,...,xn,θ])

де

.Pr[x1,x2,...,xn,θ]=Pr[x1,x2,...,xn|θ]Pr[θ]=Pr[θ]i=1nPr[xi|θ]

Слід зазначити, що існують особливі комбінації попередньої ймовірності та кандидатських розподілів Pr [ x | θ ], які призводять до легкого (закритого вигляду) оновлення, оскільки отримується більше точок даних.Pr[θ]Pr[x|θ]


1

Для оцінки щільності те, що вам потрібно, не є

.θn+1|x1,,xn

θn+1|θ1,,θn

π(dxn+1|x1,,xn)

Вибірка з наведеного розподілу може бути здійснена або за допомогою умовних методів, або з граничними методами. Для умовних методів погляньте на документ Стівена Уокера [1]. Для граничних методів слід перевірити документ Radford Neal [2].

αααα

[1] SG, Walker (2006). Відбір проби суміші Діріхле з шматочками. Комунікації в статистиці (моделювання та обчислення).

[2] Р.М., Ніл (2000) Методи ланцюга Маркова Монте-Карло для моделей сумішей Процесу Діріхле. Журнал обчислювальної та графічної статистики. Випуск 9, № 2, с. 249-265

[3] М., Захід (1992). Оцінка гіперпараметрів у моделях технологічних сумішей Діріхле. Технічний звіт


-1

Чи є якийсь підхід до оновлення F, заснований на моїх нових читаннях?

Існує щось саме для цього. Це майже головна ідея байєсівського висновку.

p(θ|y)p(y|θ)p(θ)

p(θ)Fp(y|θ)θ

p(θ)


3
FX1,,XniidFFL(F)=i=1NdFdx|x=xiF
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.