Чому саме використовується спостережена інформація Фішера?


17

У стандартному налаштуваннях максимальної вірогідності (iid зразок з деякого розподілу з щільністю )) і у випадку коректно вказаної моделі Фішер інформацію надає f y ( y | θ 0Y1,,Ynfy(y|θ0

I(θ)=Eθ0[2θ2lnfy(θ)]

де очікування приймається щодо справжньої щільності, яка генерувала дані. Я читав, що спостерігається інформація Фішера

J^(θ)=2θ2lnfy(θ)

використовується первинним, оскільки інтеграл, який бере участь у обчисленні (очікуваної) інформації про Фішера, в деяких випадках може бути неможливим. Мене бентежить те, що навіть якщо інтеграл виконаний, очікування потрібно сприймати щодо справжньої моделі, яка включає невідоме значення параметра . Якщо це так , то виявляється , що , не знаючи \ theta_ {0} неможливо обчислити I . Це правда? θ 0 Iθ0θ0I

Відповіді:


13

Тут у вас чотири кванти: справжній параметр θ0 , послідовна оцінка θ^ , очікувана інформація I(θ) в θ та спостережувана інформація J(θ) в θ . Ці кількості є еквівалентними лише асимптотично, але, як правило, вони використовуються.

  1. Інформація, що спостерігається

    J(θ0)=1Ni=1N2θ02lnf(yi|θ0)
    ймовірно переходить до очікуваної інформації I (\ theta_0) = E _ {\ theta_0} \ зліва [\ frac {\ част ^ 2} {\ част \ \ theta_0 ^ 2} \ ln f (y | \ theta_0) \ право]
    I(θ0)=Eθ0[2θ02lnf(y|θ0)]
    коли Y - зразок iid з f (\ theta_0)f(θ0) . Тут Eθ0(x) вказує на очікування w / r / t розподілу, індексованого θ0 : xf(x|θ0)dx . Це зближення справедливо через закон великих чисел, тому припущення, що Yf(θ0) тут є вирішальним.
  2. Коли у вас є оцінка яка вірогідно збігається з істинним параметром (тобто є послідовною), ви можете замінити її в будь-якому місці, де ви бачите вище, по суті завдяки теоремі безперервного відображення , і всі конвергенції продовжують утримуватися.θ^θ0θ0

Насправді це здається трохи тонким .

Зауваження

Як ви думали, із спостережуваною інформацією, як правило, простіше працювати, оскільки диференціація легша за інтеграцію, і ви, можливо, вже оцінили її під час чисельної оптимізації. За деяких обставин (Нормальний розподіл) вони будуть однаковими.

У статті «Оцінка точності максимального вірогідного оцінювача: спостережувана порівняно з очікуваною інформацією про рибалки» Ефрона та Хінклі (1978) викладено аргумент на користь спостережуваної інформації для кінцевих зразків.


4

Було проведено декілька симуляційних досліджень, які підтверджують теоретичні спостереження Ефрона та Хінклі (про які згадується у відповіді Ендрю), ось одне, що я знаю напевно: Мальдонадо, Г. та Ґренландія, С. (1994). Порівняння ефективності довірчих інтервалів на основі моделі, коли правильна форма моделі невідома. Епідеміологія, 5, 171-182. Я не бачив жодних досліджень, які б конфліктували. Тоді цікаво, що стандартні пакети GLM, які я знаю, використовують очікувану інформацію для обчислення інтервалів Wald. Звичайно, це не проблема, коли (як і у лінійних глобальних мережах у натуральному параметрі) спостережувані та очікувані інформаційні матриці рівні.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.