Я читаю теоретичний документ Дуга Бейтса про пакет lme4 R для того, щоб краще зрозуміти складність і змішаність моделей, і натрапив на інтригуючий результат, який я хотів би зрозуміти краще, щодо використання обмеженої максимальної ймовірності (REML) для оцінки дисперсії .
У розділі 3.3 щодо критерію REML він зазначає, що використання REML в оцінці дисперсії тісно пов'язане із застосуванням ступенів корекції свободи при оцінці відхилення від залишкових відхилень у встановленій лінійній моделі. Зокрема, "хоча зазвичай не виводяться таким чином", ступінь корекції свободи можна отримати, оцінюючи дисперсію шляхом оптимізації "критерію REML" (рівняння (28)). Критерій REML - це по суті лише ймовірність, але параметри лінійного пристосування були усунені маргіналізацією (замість того, щоб встановити їх рівним оцінці придатності, що дало б зміщення вибіркової вибірки).
Я зробив математику і перевірив заявлений результат для простої лінійної моделі з лише фіксованими ефектами. З чим я борюся - це тлумачення. Чи існує якась перспектива, з якої природно отримати оцінку дисперсії шляхом оптимізації ймовірності, коли параметри придатності були маргіналізовані? Це байєсівське відчуття, ніби я думаю про ймовірність як задню і маргіналізуючу підходящі параметри так, ніби вони є випадковими змінними.
Або виправдання в основному лише математичне - воно працює в лінійному випадку, але також є узагальнюючим?