Чи можете ви дати просте інтуїтивне пояснення методу IRLS, щоб знайти MLE GLM?


13

Фон:

Я намагаюся дотримуватися огляду Прінстона на оцінку MLE для GLM .

Я розумію основи оцінки MLE: likelihood, score, яка спостерігається і очікувана Fisher informationі Fisher scoringтехніка. І я знаю, як виправдати просту лінійну регресію з оцінкою MLE .


Питання:

Я не можу зрозуміти навіть перший рядок цього методу :(

Яка інтуїція за робочими змінними визначена як:zi

zi=η^i+(yiμ^i)dηidμi

Чому вони використовуються замість для оцінки ?yiβ

І яке їхнє відношення до того, response/link functionякий зв'язок між таημ

Якщо хтось має просте пояснення або може направити мене на більш базовий текст про це, я був би вдячний.


1
Як зауваження, для мене я дізнався про IRLS в контексті надійної (M-) оцінки, перш ніж почути про цілі рамки "GLM" (що я досі не повністю розумію). Для практичного погляду на цей підхід, як простого узагальнення найменших квадратів, я б рекомендував джерело, з яким я вперше зіткнувся: Додаток B книги "Комп'ютерне бачення" Річарда Шеліскі (безкоштовна електронна електронна книга) (перші 4 сторінки, справді, хоча ці посилання на кілька приємних прикладів також).
GeoMatt22

Відповіді:


15

Деякі роки тому я писав про це статті для своїх студентів (іспанською мовою), тому можу спробувати переписати ці пояснення тут. Я розгляну IRLS (ітеративно переосмислені найменші квадрати) через низку прикладів підвищення складності. Для першого прикладу нам потрібна концепція сім'ї масштабу локації. Нехай - функція густини, яка в якомусь сенсі зосереджена на нулі. Ми можемо побудувати сімейство густин, визначивши де - параметр масштабу і f ( x ) = f ( x ; μ , σ ) = 1f0σ>0μf0N(μ,σ)

f(x)=f(x;μ,σ)=1σf0(xμσ)
σ>0μ- параметр розташування. У моделі помилки вимірювання, де зазвичай термін помилки моделюється як нормальний розподіл, ми можемо замість цього звичайного розподілу використовувати сімейство масштабів локації, як побудовано вище. Коли є стандартним нормальним розподілом, конструкція вище дає сімейство .f0N(μ,σ)

Зараз ми будемо використовувати IRLS на деяких простих прикладах. Спочатку ми знайдемо оцінки ML (максимальна ймовірність) в моделі з щільністю Коші розподіляє сімейство локацій (тому це сім'я місцеположень). Але спочатку деякі позначення. Оцінювач найменш зважених квадратів задається де - деякі ваги. Ми побачимо, що ML-оцінювач може бути виражений у тому самому вигляді, що іf ( y ) = 1

Y1,Y2,,Yni.i.d
ц ц ц * = Σ п я = 1 ш I у I
f(y)=1π11+(yμ)2,yR,
μμшяцшяepsiя=уя - М . L(y;μ)=(1
μ=i=1nwiyii=1nwi.
wiμwiдеяка функція залишків Функцію ймовірності задає і функція вірогідності логотипу задається Його похідна щодо є де . Пишіть
ϵi=yiμ^.
l(y)=-
L(y;μ)=(1π)ni=1n11+(yiμ)2
μ l ( y )
l(y)=nlog(π)i=1nlog(1+(yiμ)2).
μ ϵi=yi-μf0(ϵ)=1
l(y)μ=0μlog(1+(yiμ)2)=2(yiμ)1+(yiμ)2(1)=2ϵi1+ϵi2
ϵi=yiμ f0 (ϵ)=1f0(ϵ)=1π11+ϵ2 і , отримуємо Знаходимо де ми використовували визначення f0(ϵ)=1π12ϵ(1+ϵ2)2
f0(ϵ)f0(ϵ)=12ϵ(1+ϵ2)211+ϵ2=2ϵ1+ϵ2.
l(y)μ=f0(ϵi)f0(ϵi)=f0(ϵi)f0(ϵi)(1ϵi)(ϵi)=wiϵi
wi=f0(ϵi)f0(ϵi)(1ϵi)=2ϵi1+ϵi2(1ϵi)=21+ϵi2.
Пам'ятаючи, що ми отримуємо рівняння яке є оціночним рівнянням IRLS. Зауважте, щоϵi=yiμ
wiyi=μwi,
  1. Ваги завжди позитивні.wi
  2. Якщо залишок великий, ми надаємо меншу вагу відповідному спостереженню.

Щоб обчислити оцінювач ML на практиці, нам потрібно початкове значення , ми могли б використовувати медіану, наприклад. За допомогою цього значення обчислюємо залишки і ваги Нове значення задається Продовжуючи таким чином, ми визначаємо і Розрахункове значення при проходженні алгоритму стає ε ( 0 ) я =уя-μ^(0)

ϵi(0)=yiμ^(0)
μ
wi(0)=21+ϵi(0).
μ^ϵ ( j ) i =yi-
μ^(1)=wi(0)yiwi(0).
ϵi(j)=yiμ^(j)
wi(j)=21+ϵi(j).
j+1
μ^(j+1)=wi(j)yiwi(j).
Продовжуючи, поки послідовність сходиться.
μ^(0),μ^(1),,μ^(j),

Зараз ми вивчаємо цей процес із більш загальним сімейством розташування та масштабу, , з меншими деталями. Нехай не залежать від щільності вище. Визначте також . Функція вірогідності логгізму - Написавши , зауважте, що та Обчислення похідної логічності f(y)=1σf0(yμσ)Y1,Y2,,Ynϵi=yiμσ

l(y)=n2log(σ2)+log(f0(yiμσ)).
ν=σ2
ϵiμ=1σ
ϵiν=(yiμ)(1ν)=(yiμ)12σ3.
l(y)μ=f0(ϵi)f0(ϵi)ϵiμ=f0(ϵi)f0(ϵi)(1σ)=1σfo(ϵi)f0(ϵi)(1ϵi)(ϵi)=1σwiϵi
і прирівнюючи це до нуля дає те саме рівняння, що оцінюється, як і перший приклад. Потім шукаємо оцінювач для : σ2^σ2
l(y)ν=n21ν+f0(ϵi)f0(ϵi)ϵiν=n21ν+f0(ϵi)f0(ϵi)((yiμ)2σ3)=n21ν121σ2f0(ϵi)f0(ϵi)ϵi=n21ν121νf0(ϵi)f0(ϵi)(1ϵi)(ϵi)ϵi=n21ν+121νwiϵi2=!0.
веде до оцінювача Ітеративний алгоритм, описаний вище, може бути використаний і в цьому випадку.
σ2^=1nwi(yiμ^)2.

Далі ми даємо числовий іспит за допомогою R для подвійної експоненціальної моделі (з відомою шкалою) та даних y <- c(-5,-1,0,1,5). Для цих даних справжнє значення оцінювача ML становить 0. Початкове значення буде mu <- 0.5. Один прохід алгоритму є

  iterest <- function(y, mu) {
               w <- 1/abs(y-mu)
               weighted.mean(y,w)
               }

з цією функцією можна експериментувати, виконуючи ітерації "вручну". Тоді ітераційний алгоритм можна виконати

mu_0 <- 0.5
repeat {mu <- iterest(y,mu_0)
        if (abs(mu_0 - mu) < 0.000001) break
        mu_0 <- mu }

Вправа: Якщо модель являє собою розподіл з параметром масштабу покажіть, що ітерації задаються вагою Вправа: Якщо щільність логістична, покажіть ваги, задані σ w itkσw(ϵ)=1-eϵ

wi=k+1k+ϵi2.
w(ϵ)=1eϵ1+eϵ1ϵ.

На даний момент я залишу його тут, продовжу цю посаду.


вау, чудове ніжне вступ! але ви завжди посилаєтесь на один параметр для всіх примірників, а джерела, які я цитував, говорять про різні на примірник. це просто банальна модифікація? u iuui
ihadanny

1
Я додам ще до цього, зараз просто поза часом! Ідеї ​​залишаються тими ж, але детальніше втягується.
kjetil b halvorsen

2
прийде до цього!
kjetil b halvorsen

1
І дякую за вправу, що показує ваги для логістичної щільності. Зробив це і багато чому навчився цьому процесу. Я не знаю дистрибуції , нічого не можу знайти про це ...tk
ihadanny

2
Ви не проти писати десь повідомлення в блозі, продовжуючи це пояснення? дуже корисно для мене, і я впевнений, що буде для інших ...
ihadanny
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.