Приміщення: це може бути дурним питанням. Я знаю лише твердження про асимптотичні властивості MLE, але я ніколи не вивчав докази. Якби я це зробив, можливо, я б не задавав цих питань, або, можливо, я зрозумів би, що ці питання не мають сенсу ... тому, будь ласка, просто на мене :)
Я часто бачив твердження, які говорять про те, що оцінка MLE параметрів моделі є асимптотично нормальним і ефективним. Заява зазвичай пишеться як
N→∞ як
де - кількість зразків, - інформація про Фішера, а - справжнє значення параметра (вектор) . Тепер, оскільки є посилання на справжню модель, чи означає це, що результат не буде мати значення, якщо модель не відповідає дійсності?
Приклад: припустимо, я моделюю потужність від вітрової турбіни як функцію швидкості вітру плюс додаткового гауссового шуму
Я знаю, що модель помилкова, принаймні з двох причин: 1) дійсно пропорційна третій потужності і 2) помилка не є додатковою, тому що я знехтував іншими прогнозами, які не співвідносяться зі швидкістю вітру (я також знаю що має бути 0, оскільки при 0 швидкості вітру не виробляється енергія, але це не актуально тут). Тепер, припустимо, я маю нескінченну базу даних про потужність і швидкість вітру від моєї вітрогенератора. Я можу намалювати стільки бажаних зразків, будь-якого розміру. Припустимо, я малюю 1000 зразків, кожен розміром 100, і обчислюю \ hat {\ boldsymbol {\ beta}} _ {100} , оцінка MLE \ boldsymbol {\ beta} = (\ beta_0, \ beta_1, \ beta_2)V β 0(що за моєю моделлю було б просто оцінкою OLS). Таким чином, у мене є 1000 зразків з розподілу . Я можу повторити вправу з . Як , чи має розподіл бути асимптотично нормальним, із заявленим середнім значенням та дисперсією? Або той факт, що модель неправильна, недійсний цей результат?
Причина, про яку я питаю, полягає в тому, що рідко (якщо і взагалі) модель є "справжньою" в додатках. Якщо асимптотичні властивості MLE втрачаються, коли модель не відповідає дійсності, можливо, має сенс використовувати різні принципи оцінювання, які, хоча і менш потужні в налаштуваннях, де модель правильна, в інших випадках можуть працювати краще, ніж MLE.
EDIT : в коментарях зазначалося, що поняття справжньої моделі може бути проблематичним. Я мав на увазі таке визначення: з урахуванням сімейства моделей позначеного вектором параметрів , для кожної моделі в сім'ї завжди можна написати
просто визначивши як . Однак, як правило, помилка не буде ортогональною для , має середнє значення 0, і не обов'язково передбачатиметься розподіл при виведенні моделі. Якщо існує значення таке, що має ці два властивості, а також припущений розподіл, я б сказав, що модель є правдою. Я думаю, що це безпосередньо пов'язано з тим, що , оскільки термін помилки при розкладанні
має дві властивості, згадані вище.