Це звичайне твердження про експоненціальну родину, але, на мою думку, більшість випадків це висловлюється таким чином, що може бентежити менш досвідченого читача. Тому що, взяті за номіналом, це можна інтерпретувати так, що "якщо наша випадкова величина слідує за розподілом в експоненціальній сім'ї, то якщо ми візьмемо вибірку і введемо її в достатню статистику, ми отримаємо справжнє очікуване значення статистики ". Якби це було так ... Більше цього він не враховує розмір вибірки, що може спричинити подальше плутанину.
Функція експоненціальної щільності - це
fX(x)=h(x)eη(θ)T(x)e−A(θ)(1)
де є достатньою статистикою.T(x)
Оскільки це щільність, вона повинна інтегруватися до єдності, тому ( є підтримкою )SxX
∫Sxh(x)eη(θ)T(x)e−A(θ)dx=1(2)
Eq справедливо для всіх щоб ми могли диференціювати обидві сторони стосовно нього:(2)θ
∂∂θ∫Sxh(x)eη(θ)T(x)e−A(θ)dx=∂(1)∂θ=0(3)
Змінюючи порядок диференціації та інтеграції, отримуємо
∫Sx∂∂θ(h(x)eη(θ)T(x)e−A(θ))dx=0(4)
Проведення диференціації у нас
∂∂θ(h(x)eη(θ)T(x)e−A(θ))=fX(x)[T(x)η′(θ)−A′(θ)](5)
Вставивши в отримаємо(5)(4)
∫SxfX(x)[T(x)η′(θ)−A′(θ)]dx=0
⇒η′(θ)E[T(X)]−A′(θ)=0⇒E[T(X)]=A′(θ)η′(θ)(6)
Тепер ми запитуємо: ліва частина - це дійсне число. Отже, правий бік також повинен бути справжнім числом, а не функцією . Тому його слід оцінювати за конкретним , і воно повинно бути "істинним" , інакше в лівій частині ми не мали б справжнього очікуваного значення . Щоб підкреслити це, позначимо справжнє значення через , і як(6)θθT(X)θ0(6)
Eθ0[T(X)]=A′(θ)η′(θ)∣∣θ=θ0(6a)
Перейдемо зараз до максимальної оцінки ймовірності . Імовірність журналу для вибірки розміру дорівнюєn
L(θ∣x)=∑i=1nlnh(xi)+η(θ)∑i=1nT(xi)−nA(θ)
Встановивши його похідну відносно дорівнює отримаємо MLEθ0
θ^(x):1n∑i=1nT(xi)=A′(θ)η′(θ)∣∣θ=θ^(x)(7)
Порівняйте з . Права сторона не є рівною, оскільки ми не можемо стверджувати, що оцінювач MLE вплинув на справжнє значення. Тож ні ліві боки. Але пам’ятайте, що ек. утримується для всіх а також для також. Отже, кроки в екв. можна прийняти відносно і тому ми можемо написати еквівалент. для :(7)(6a)2 θθ^3,4,5,6θ^6aθ^
Eθ^(x)[T(X)]=A′(θ)η′(θ)∣∣θ=θ^(x)(6b)
що в поєднанні з призводить нас до дійсного відношення(7)
Eθ^(x)[T(X)]=1n∑i=1nT(xi)
про що насправді говорить твердження, яке перевіряється: очікуване значення достатньої статистики під MLE для невідомих параметрів (іншими словами, значення першого необробленого моменту розподілу, який ми отримаємо, якщо будемо використовувати замість ) дорівнює (і це не просто наближається до) середнього рівня достатньої статистики, обчисленої з вибірки . θ^(x)θx
Більше того, лише якщо розмір вибірки ми могли б точно сказати, "очікуване значення достатньої статистики за MLE дорівнює достатній статистиці".n=1