Припустимо, у мене є набір незалежних, однаково розподілених одномірних спостережень та дві гіпотези про те, як генерується :
: виведено з одного гауссового розподілу з невідомими середніми та дисперсійними.
: виводиться із суміші двох гауссів з невідомим середнім, дисперсійним та коефіцієнтом змішування.
Якщо я правильно розумію, це вкладені моделі, оскільки модель, яку представляє, може бути описана в термінах якщо ви обмежите параметри двох гауссів однаковими або обмежуєте коефіцієнт змішування рівним нулю для одного з двох гауссів.
Тому, схоже, ви повинні мати можливість використовувати алгоритм ЕМ для оцінки параметрів а потім використовувати Теорему Вілкса, щоб визначити, чи вірогідність даних у значно більша, ніж у . Існує невеликий стрибок віри в припущення, що алгоритм ЕМ зблизиться до максимальної ймовірності, але це я хочу зробити.
Я спробував це в симуляції Монте-Карло, припускаючи, що має 3 ступеня свободи, ніж (середнє значення та дисперсія для другого гаусса та параметра змішування). Коли я імітував дані , я отримав розподіл значень P, який був суттєво нерівномірним та збагаченим для малих P-значень. (Якби ЕМ не збігався з справжньою максимальною вірогідністю, можна було б очікувати прямо протилежне.) Що не так із моїм застосуванням теореми Вілкса, яка створює цю зміщення?