Виведення нормалізуючого перетворення для ГЛМ


15

Як A()=duV1/3(μ) нормалізує перетворення для експонентної сім'ї похідне?

Більш конкретно : я спробував виконати ескіз розширення Тейлора на сторінці 3, слайд 1 тут, але у мене є кілька питань. З X з експоненціальної родини, перетворення h(X) та κi що позначає купілятор ith , слайди стверджують, що:

κ3(h(X¯))h(μ)3κ3(X¯)N2+3h(μ)2h(μ)σ4N+O(N3),
і залишається просто знайти h(X) таким, що вищезгадане оцінює до 0.
  1. Перше моє запитання стосується арифметики: моє розширення Тейлора має різні коефіцієнти, і я не можу виправдати те, що вони втратили багато термінів.

    Since h(x)h(μ)+h(μ)(xμ)+h(x)2(xμ)2, we have:h(X¯)h(u)h(u))(X¯μ)+h(x)2(X¯μ)2E(h(X¯)h(u))3h(μ)3E(X¯μ)3+32h(μ)2h(μ)E(X¯μ)4+34h(μ)h(μ)2E(X¯μ)5+18h(μ)3E(X¯μ)6.

    Я можу дістатись до чогось подібного, замінивши центральні моменти на їх сукупні еквіваленти, але це все ще не складається.

  2. Друге питання: чому аналіз починається з X¯ замість X , величини, яка насправді нас цікавить?


Ви , здається, кілька разів , коли ви маєте в видуuμ
Glen_b -Reinstate Моніку

Відповіді:


2

Слайди, на які ви посилаєтесь, дещо заплутані, виключаючи кроки та роблячи кілька помилок, але в кінцевому рахунку вони правильні. Це допоможе відповісти на запитання 2 спочатку, потім 1, а потім нарешті отримати симетризуючу трансформацію .A(u)=u1[V(θ)]1/3dθ

Питання 2. Ми аналізуємо як це середнє значення для вибірки розміру iid випадкових величин . Це важлива кількість, тому що вибірки одного і того ж розподілу та взяття середнього відбувається в науці постійно. Ми хочемо знати, наскільки близький до справжньої середньої . Центральна гранична теорема говорить, що вона буде сходитися до як але ми хотіли б знати дисперсію та косисть .X¯NX1,...,XNX¯μμNX¯

Питання 1. Ваша апроксимація рядів Тейлора невірна, але нам слід бути обережними щодо відстеження проти та повноважень щоб дійти до того самого висновку, що і слайди. Почнемо з визначення та центральних моментів та отримаємо формулу для :X¯XiNX¯Xiκ3(h(X¯))

X¯=1Ni=1NXi

E[Xi]=μ

V(Xi)=E[(Xiμ)2]=σ2

κ3(Xi)=E[(Xiμ)3]

Тепер центральні моменти :X¯

E[X¯]=1Ni=1NE[Xi]=1N(Nμ)=μ

V(X¯)=E[(X¯μ)2]=E[((1Ni=1NXi)μ)2]=E[(1Ni=1N(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2

Останній крок випливає з і . Це може бути не найпростішим виведенням , але це той самий процес, який ми повинні зробити, щоб знайти та , де ми розбиваємо добуток підсумовування і підраховуємо кількість доданків з потужностями різних змінних. У вищенаведеному випадку було термінів, які мали вигляд та терміни форми .E[Xiμ]=0E[(Xiμ)2]=σ2V(X¯)κ3(X¯)κ3(h(X¯))N(Xiμ)2N(N1)(Xiμ)(Xjμ)

κ3(X¯)=E[(X¯μ)3)]=E[((1Ni=1NXi)μ)3]=E[(1Ni=1N(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2

Далі ми розширимо у серії Тейлора, як у вас є:h(X¯)

h(X¯)=h(μ)+h(μ)(X¯μ)+12h(μ)(X¯μ)2+13h(μ)(X¯μ)3+...

E[h(X¯)]=h(μ)+h(μ)E[X¯μ]+12h(μ)E[(X¯μ)2]+13h(μ)E[(X¯μ)3]+...=h(μ)+12h(μ)σ2N+13h(μ)κ3(Xi)N2+...

Доклавши більше зусиль, ви могли б довести решту термінів . Нарешті, оскільки , (що не те саме, що ), ми знову робимо аналогічний обчислення:O(N3)κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]E[(h(X¯)h(μ))3]

κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]=E[(h(μ)+h(μ)(X¯μ)+12h(μ)(X¯μ)2+O((X¯μ)3)h(μ)12h(μ)σ2NO(N2))3]

Нас цікавлять лише умови, що призводять до порядку , і з додатковою роботою ви можете показати, що вам не потрібні терміни " "або" "перед тим, як приймати третю потужність, оскільки вони матимуть результат лише в порядку порядку . Отже, спрощуючи, ми отримуємоO(N2)O((X¯μ)3)O(N2)O(N3)

κ3(h(X¯))=E[(h(μ)(X¯μ)+12h(μ)(X¯μ)212h(μ)σ2N))3]=E[h(μ)3(X¯μ)3+18h(μ)3(X¯μ)618h(μ)3σ6N3+32h(μ)2h(μ)(X¯μ)4+34h(μ)h(μ)(X¯μ)532h(μ)2h(μ)(X¯μ)2σ2N+O(N3)]

Я залишив кілька термінів, які, очевидно, були у цьому творі. Ви повинні переконати себе , що терміни і є також. Однак,O(N3)E[(X¯μ)5]E[(X¯μ)6]O(N3)

E[(X¯μ)4]=E[1N4(i=1N(X¯μ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)

Тоді розподіляючи очікування нашого рівняння для , маємоκ3(h(X¯))

κ3(h(X¯))=h(μ)3E[(X¯μ)3]+32h(μ)2h(μ)E[(X¯μ)4]32h(μ)2h(μ)E[(X¯μ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h(μ)σ4N232h(μ)2h(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2+O(N3)

На цьому завершується виведення . Тепер, нарешті, ми отримаємо симетризуючу трансформацію .κ3(h(X¯))A(u)=u1[V(θ)]1/3dθ

Для цього перетворення важливо, щоб був із експоненціального сімейного розподілу, і, зокрема, природного експоненціального сімейства (або він був перетворений у цей розподіл), виглядуXifXi(x;θ)=h(x)exp(θxb(θ))

У цьому випадку сукупність розподілу задається . Тож , і . Ми можемо записати параметр як функцію просто взявши обернене , записавши . Потімκk=b(k)(θ)μ=b(θ)σ2=V(θ)=b(θ)κ3=b(θ)θμbθ(μ)=(b)1(μ)

θ(μ)=1b((b)1(μ))=1b(θ))=1σ2

Далі ми можемо записати дисперсію як функцію і викликати цю функцію :μV¯

V¯(μ)=V(θ(μ))=b(θ(μ))

Потім

ddμV¯(μ)=V(θ(μ))θ(μ)=b(θ)1σ2=κ3σ2

Отже, як функція , .μκ3(μ)=V¯(μ)V¯(μ)

Тепер для симетризуючого перетворення ми хочемо зменшити косисть , зробивши щоб було . Таким чином, ми хочемоh(X¯)h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2=0h(X¯)O(N3)

h(μ)3κ3(Xi)+3h(μ)2h(μ)σ4=0

Підставляючи наші вирази для та як функції , ми маємо:σ2κ3μ

h(μ)3V¯(μ)V¯(μ)+3h(μ)2h(μ)V¯(μ)2=0

Тож , що веде до .h(μ)3V¯(μ)+3h(μ)2h(μ)V¯(μ)=0ddμ(h(μ)3V¯(μ))=0

Одне рішення цього диференціального рівняння:

h(μ)3V¯(μ)=1 ,

h(μ)=1[V¯(μ)]1/3

Отже, , для будь-якої константи, . Це дає нам симетризуюче перетворення , де - дисперсія як функція середнього значення в природній експоненціальній сім'ї.h(μ)=cμ1[V¯(θ)]1/3dθcA(u)=u1[V(θ)]1/3dθV


1

1.Чому я не можу отримати той самий результат, наблизившись до нецентральних моментів а потім обчислити центральні моменти використовуючи наближаючі нецентральні моменти?EX¯kE(X¯EX¯)k

Тому що ви змінюєте деривацію довільно і скидаєте важливий термін залишку. Якщо ви не знайомі з великою нотацією O та відповідними результатами, хороша довідка - [Casella & Lehmann].

h(X¯)h(u)h(u)(X¯μ)+h(x)2(X¯μ)2+O[(X¯μ)3]

E[h(X¯)h(u)]h(u)E(X¯μ)+h(x)2E(X¯μ)2+(?)

Але навіть якщо ви не кинете залишок, стверджуючи, що ви завжди робите (що не є законним ...), наступний крок: говорить, щоN

\E(h(X¯)h(u))3h(μ)3\E(X¯μ)3+32h(μ)2h(μ)\E(X¯μ)4+34h(μ)h(μ)2\E(X¯μ)5+18h(μ)3\E(X¯μ)6.(1)
[h(x)h(x0)]3dx=[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3dx=(1)

якщо це все ще не зрозуміло, ми можемо побачити, що алгебра розширення інтеграла йде так

[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3(2)

Нехай , ,A=h(x0)(xx0)B=12h(x0)(xx0)2C=O((xx0)3) (2)=[A+B+C]3 [A3+3A2B+3AB2+B3]=[A+B]3=(1)

Ваша помилка полягає в тому, щоб опустити залишок перед розширенням, що є "класичною" помилкою у великій нотації O, а пізніше стала критикою використання великої нотації O.

Чому аналіз починається з замість , кількості, яка насправді нас цікавить?X¯X

Тому що ми хочемо базувати свій аналіз на достатній статистиці експоненціальної моделі, яку ми вводимо. Якщо у вас є вибірка розміром 1, то немає різниці, чи аналізуєте ви з АБО .X¯=1ni=1nXiX1

Це хороший урок з великої нотації O, хоча це не стосується GLM ...

Довідка [Casella & Lehmann] Lehmann, Erich Leo та George Casella. Теорія оцінки балів. Springer Science & Business Media, 2006.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.