Тривалий час я замислювався над начебто поширеною думкою, що існує певна принципова різниця у фіксованих та випадкових ефектах для (як правило, нелінійних) моделей змішаних ефектів. Таку віру, наприклад, висловив Бейтс у наступній відповіді
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html
L(x,u)g(x,u)Pg(t)g
Pg(t)=maxx,u{L(x,u) | g(x,u)=t}\eqno(1)
Я вважаю, що з цим ніхто не сперечається. Тепер припустимо, що ми маємо попереднє розподіл ймовірностей для u. Тоді я б стверджував, що ймовірність профілю для все ж має сенс, але нам слід змінити (1), включивши попередній.p(u)g
Pg(t)=maxx,u{L(x,u)p(u) | g(x,u)=t}\eqno(2)
Зауважимо, що оскільки - параметр з до цього він точно такий же, як і те, що називається випадковим ефектом. То чому багато людей думають, що параметри випадкових ефектів якимось різними. Я вважаю, що різниця виходить із звичної для них практики оцінки параметрів. Що робить випадкові ефекти `` різними '', це те, що їх багато в багатьох моделях. В результаті для отримання корисних оцінок за фіксованими ефектами (або іншими параметрами) необхідно трактувати випадкові ефекти по-іншому. Що ми робимо - це інтегрувати їх із моделі. У наведеній вище моделі ми формували б вірогідність де
Тепер
uF(x)F(x)=∫L(x,u)p(u)du
uпішли. Отже, якщо все, що ми маємо, є здається, немає сенсу говорити про ймовірність профілю для деякої функції .
F(x)g(x,u)
Отже, щоб отримати інформацію про функцію ми не повинні інтегруватися над параметром . Але що відбувається в тому випадку, коли є безліч випадкових параметрів ефекту. Тоді я стверджую, що нам слід інтегруватись над `` більшості '', але не всі вони в певному сенсі я стану точним. Щоб мотивувати побудову, нехай буде випадкових ефектів
. Розглянемо особливий випадок, коли функція залежить лише від , а насправді є найпростішою функцією, яку можна уявити, . Інтегруйте через випадкові ефекти щоб отримати
g(x,u)unu=(u1,u2,...,un−1,un)g(x,u)ung(x,u)=unu1,u2,...,un−1
F(x,un)=∫L(x,u1,...,un)p(u1,...,un))du1du2...dun−1\eqno(4)
так, як раніше ми можемо сформувати ймовірність профілю
Як узагальнити щоб мати сенс для довільної функції . Добре зауважте, що визначення у
те саме, що
Щоб побачити цю примітку, що для простого випадку ,
те саме, що
Pg(t)=maxx,un{F(x,un)|un=t}\eqno(3)
(3)g(x,u)F(x,un)(4)F(x,s)=limϵ→01ϵ∫{(x,un)|s−ϵ/2<g(x,un)<s+ϵ/2}L(x,u1,...,un)p(u1,...,un))du1du2...dun\eqno(5)
g(x,u)=un(5)F(x,s)=limϵ→01ϵ∫{(x,un)|s−ϵ/2<un<s+ϵ/2}F(x,un)dun\eqno(6)
Для загальної функції формуємо функцію
визначену і обчислюємо ймовірність профілю
g(x,u)F(x,s)(5)
Pg(s)=maxx,u{F(x,s)|g(x,u)=s}\eqno(3)
Ця ймовірність профілю є чітко визначеною концепцією і стоїть на ній самостійно. Однак, щоб бути корисним на практиці, потрібно вміти обчислювати його значення, принаймні приблизно. Я вважаю, що для багатьох моделей функцію можна досить наблизити, використовуючи варіант наближення Лапласа. Визначте за допомогою
Нехай H - гессіан журналу функції щодо параметрів і .F(x,s)x^(s),u^(s)
x^(s),u^(s)=maxx,u{L(x,u)p(u) | g(x,u)=s}
−L(x,u)p(u)xu
Набори рівнів являють собою мірне підмножини розмірного простору, де є фіксованих ефектів і випадкових ефектів. Нам потрібно інтегрувати форму
над цим колектором, де все лінеаризовано у
Це включає трохи елементарної диференціальної геометрії. Припустимо, що
Репараметризацією можна припустити, що і . Потім розглянемо карту
gm+n−1n+mmnndu1∧du2∧…∧dunx^(s),u^(s)gxn(x^(s),u^(s))≠0x^(s)=0u^(s)=0
(x1,x2,…,xm−1,u1,u2,…,un)→(x1,x2,…,xm−1,−∑m−1i=1gxixi−∑ni=1guiuigxm,u1,u2,…,un)
,
де використовується для позначають часткове похідне по відношенню до оціненому
в максимальній точці. Це лінійна карта розмірного простору на дотичний простір набору рівнів . Ми можемо використовувати його для обчислення потрібного інтеграла. По-перше, відкат 1 форм це просто вони самі.
gxigxim+n−1gdui
Відступ Гессі є квадратичною формою
Ti,j=Hi+m,j+m+guigujgxm2Hm,m\rm for 1<=i,j<=n
Тож інтеграл можна обчислити (або наблизити) за наближенням Лапласа, що є звичайною формулою, що включає логарифм визначника , який обчислюється за допомогою розкладання Холеського. Значення наближення Лапласа інтеграла дорівнює
деє визначальним. нам ще потрібно розібратися з шириною набору рівнів як
Для першого замовлення це має значення
де - вектор часткових похідних
л ( х ( и ) , у ( и ) ) | - Т | 1T
L(x^(s),u^(s))|−T|12
|⋅|gϵ→0ϵ/∥∇g(x^(s),u^(s))∥∇g(x^(s),u^(s)))g (gx1,gx2,…,gxm,gu1,gu2,…,gun) ,
так що значення ймовірності на безлічі рівня дається від
Це правильне наближення, яке слід використовувати для обчислення ймовірності профілю.
gL(x^(s),u^(s))|−T|12∥∇g(x^(s),u^(s))∥