Р. В. Футц і Р. С. Срівастава детально вивчили це питання. Їх документ 1977 року "Виконання тесту на коефіцієнт ймовірності, коли модель невірна", містить виклад результату розподілу у разі неправильної уточнення поряд із дуже коротким ескізом доказування, а їхній документ 1978 року - "Асимптотичний розподіл коефіцієнта ймовірності, коли модель неправильна " містить доказ - але останній набирається у старомодному машинописі (хоча обидва документи використовують одне і те ж позначення, тому ви можете комбінувати їх при читанні). Крім того, для деяких етапів доказування вони посилаються на документ К.П. Роя "Записка про асимптотичний розподіл коефіцієнта ймовірності" від 1957 року, який, здається, не доступний в режимі он-лайн, навіть закритий.
У випадку неправильної специфікації розподілу, якщо MLE все ще є послідовною і асимптотично нормальною (що не завжди буває), LR статистика слідує за асимптотикою лінійною комбінацією незалежних чі-квадратів (кожен з одного ступеня свободи)
- 2 лнλ →г∑i = 1rciχ2i
де . Можна побачити "схожість": замість одного chi-квадрата з ступенями свободи ми маємо chi-квадрати з кожним ступенем свободи. Але "аналогія" зупиняється на цьому, оскільки лінійна комбінація хі-квадратів не має щільності закритої форми. Кожен масштабований квадрат-чі - це гамма, але з іншим параметром що призводить до іншого масштабного параметра для гами - і сума таких гам не є закритою формою, хоча його значення можна обчислити.h - m h - m c ir = h - mч - мч - мci
Для констант маємо , і вони є власними значеннями матриці ... яка матриця? Добре, використовуючи позначення авторів, встановіть як гессея вірогідності журналу, а - зовнішнім добутком градієнта зручності ймовірності (в очікуванні). Отже є асимптотичною дисперсійно-коваріаційною матрицею MLE.c 1 ≥ c 2 ≥ . . . c r ≥ 0 Λ C V = Λ - 1 C ( Λ ′ ) - 1cic1≥ c2≥ . . . cr≥ 0ΛСV= Λ- 1С( Λ')- 1
Потім встановіть бути верхній діагональний блок . r × r VМr × rV
Також запишіть у вигляді блокуΛ
Λ = [ Λr × rΛ2Λ'2Λ3]
і встановимо ( - мінус доповнення Шура ). W ΛW= - Λr × r+ Λ'2Λ- 13Λ2WΛ
Тоді - це власні значення матриці оцінені за справжніми значеннями параметрів. M WciМW
ДОПОЛНЕННЯ
Відповідаючи на дійсне зауваження ОП у коментарях (іноді, справді, питання стають плацдармом для спільного отримання більш загального результату, і самі можуть бути знехтувані в процесі), ось як відбувається доказ Вількса: Вілкс починає спільну роботу нормальний розподіл MLE і переходить до отримання функціонального вираження коефіцієнта ймовірності. До і включаючи його еквівалент. , доказ може рухатися вперед, навіть якщо припустити, що ми маємо неправильну специфікацію розподілу: як зазначає ОП, умови матриці коваріації дисперсії будуть різними в сценарії помилок, але все, що має Уілкс, - це брати похідні та ідентифікувати асимптотично незначні терміни. І так він прибуває на екв. де ми бачимо, що коефіцієнт ймовірності є статистичним,[ 9 ] год - м год - м[ 9 ][ 9 ]якщо специфікація правильна, - це лише сума квадраті стандартних звичайних випадкових величин, і тому вони розподіляються як один чі-квадрат зі ступенями свободи : (загальне позначення)ч - мч - м
- 2 лнλ = ∑i = 1ч - м( н--√θ^i- θiσi)2→гχ2ч - м
Але якщо у нас є помилки специфікації, то терміни, які використовуються для того , щоб масштабувати центрированную і збільшене MLE більше не умови , які роблять відхилення кожного елемента дорівнює одиниці, і таким чином перетворіть кожен доданок у стандартний нормальний rv, а суму - в квадрат-chi.
І це не так, оскільки ці терміни передбачають очікувані значення другої похідної вірогідності ймовірності ... але очікуване значення можна сприймати лише щодо справжнього розподілу, оскільки MLE - це функція даних і Дані слід за істинним розподілом, тоді як другі похідні log-ймовірності обчислюються виходячи з неправильного припущення про щільність. н--√( θ^- θ )
Отже, під помилковим визначенням у нас є щось на зразок
і найкраще, що ми можемо зробити, - це маніпулювати цим
-2 лнλ =∑i =1ч - м(н--√θ^i-θiаi)2
- 2лнλ = ∑i = 1ч - мσ2iа2i( н--√θ^i- θiσi)2= ∑i = 1ч - мσ2iа2iχ21
що є сумою масштабованих чи-квадратних обертів, більше не розподілених як один чи-квадратний rv з ступенями свободи. Посилання, надане ОП, дійсно є дуже чітким описом цього більш загального випадку, що включає результат Вількса як особливий випадок.ч - м