Експоненціальна сім'я: спостережена порівняно з очікуваною достатньою статистикою


10

Моє запитання виникає при читанні читання "Мінки Діріхле" розподілу Мінки , в якому зазначено наступне без доказів у контексті отримання оцінки максимальної ймовірності розподілу Діріхле на основі спостережень за випадковими векторами:

Як і завжди з експоненціальною сім'єю, коли градієнт дорівнює нулю, очікувана достатня статистика дорівнює достатній статистиці, що спостерігається.

Я не бачив оцінювання максимальної ймовірності в експонентній родині, представленої таким чином, і не знайшов підходящих пояснень у своєму пошуку. Чи може хтось запропонувати зрозуміти залежність між спостережуваною та очікуваною достатньою статистикою, а може допомогти зрозуміти максимальну оцінку ймовірності як мінімізацію їх різниці?

Відповіді:


11

Це звичайне твердження про експоненціальну родину, але, на мою думку, більшість випадків це висловлюється таким чином, що може бентежити менш досвідченого читача. Тому що, взяті за номіналом, це можна інтерпретувати так, що "якщо наша випадкова величина слідує за розподілом в експоненціальній сім'ї, то якщо ми візьмемо вибірку і введемо її в достатню статистику, ми отримаємо справжнє очікуване значення статистики ". Якби це було так ... Більше цього він не враховує розмір вибірки, що може спричинити подальше плутанину.

Функція експоненціальної щільності - це

(1)fX(x)=h(x)eη(θ)T(x)eA(θ)

де є достатньою статистикою.T(x)

Оскільки це щільність, вона повинна інтегруватися до єдності, тому ( є підтримкою )SxX

(2)Sxh(x)eη(θ)T(x)eA(θ)dx=1

Eq справедливо для всіх щоб ми могли диференціювати обидві сторони стосовно нього:(2)θ

(3)θSxh(x)eη(θ)T(x)eA(θ)dx=(1)θ=0

Змінюючи порядок диференціації та інтеграції, отримуємо

(4)Sxθ(h(x)eη(θ)T(x)eA(θ))dx=0

Проведення диференціації у нас

(5)θ(h(x)eη(θ)T(x)eA(θ))=fX(x)[T(x)η(θ)A(θ)]

Вставивши в отримаємо(5)(4)

SxfX(x)[T(x)η(θ)A(θ)]dx=0

(6)η(θ)E[T(X)]A(θ)=0E[T(X)]=A(θ)η(θ)

Тепер ми запитуємо: ліва частина - це дійсне число. Отже, правий бік також повинен бути справжнім числом, а не функцією . Тому його слід оцінювати за конкретним , і воно повинно бути "істинним" , інакше в лівій частині ми не мали б справжнього очікуваного значення . Щоб підкреслити це, позначимо справжнє значення через , і як(6)θθT(X)θ0(6)

(6a)Eθ0[T(X)]=A(θ)η(θ)|θ=θ0

Перейдемо зараз до максимальної оцінки ймовірності . Імовірність журналу для вибірки розміру дорівнюєn

L(θx)=i=1nlnh(xi)+η(θ)i=1nT(xi)nA(θ)

Встановивши його похідну відносно дорівнює отримаємо MLEθ0

(7)θ^(x):1ni=1nT(xi)=A(θ)η(θ)|θ=θ^(x)

Порівняйте з . Права сторона не є рівною, оскільки ми не можемо стверджувати, що оцінювач MLE вплинув на справжнє значення. Тож ні ліві боки. Але пам’ятайте, що ек. утримується для всіх а також для також. Отже, кроки в екв. можна прийняти відносно і тому ми можемо написати еквівалент. для :(7)(6a)2 θθ^3,4,5,6θ^6aθ^

(6b)Eθ^(x)[T(X)]=A(θ)η(θ)|θ=θ^(x)

що в поєднанні з призводить нас до дійсного відношення(7)

Eθ^(x)[T(X)]=1ni=1nT(xi)

про що насправді говорить твердження, яке перевіряється: очікуване значення достатньої статистики під MLE для невідомих параметрів (іншими словами, значення першого необробленого моменту розподілу, який ми отримаємо, якщо будемо використовувати замість ) дорівнює (і це не просто наближається до) середнього рівня достатньої статистики, обчисленої з вибірки . θ^(x)θx

Більше того, лише якщо розмір вибірки ми могли б точно сказати, "очікуване значення достатньої статистики за MLE дорівнює достатній статистиці".n=1


Чи можете ви детальніше пояснити, чому перехід від 6a до 6b дійсний, будь ласка?
Теоден

1
@Theoden Між екв. і я пишу "еквівалент утримується для всіх " - і тому для також. Отже всі кроки в еквіваленті. можна прийняти стосовно . Я повторив це зауваження в тексті для наочності. (2)(3)(2) θθ^3,4,5,6θ^
Алекос Пападопулос

@AlecosPapadopoulos, наведений нижче, здається, говорить про те, що те, що ви говорите на початку, - "якщо наша випадкова величина слідує за розподілом в експоненціальній сім'ї, то якщо ми візьмемо вибірку і введемо її в достатню статистику, ми отримаємо справжнє очікуване значення статистики "вірно. Я маю на увазі, що я завжди завжди можу це зробити для (2), замінивши його на достатньо спостережувану статистику та отримати результат. Що я тут пропускаю? Я не дуже розумію.
користувач10024395

@ user136266 Справжнє очікуване значення статистики - , і для того, щоб обчислити, треба знати параметр за невідомим дизайном . Тож, що ми можемо насправді обчислити, це що є очікуваним значенням статистики за припущенням, що наша бальна оцінка досягла справжнього значення . 6aθ6b
Алекос Пападопулос

1
Чи можете ви пояснити, чому ми можемо змінювати порядок диференціації та інтеграції в рівнянні. (3) будь ласка?
Markus777
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.