Яка різниця між "функцією зв'язку" та "канонічною функцією зв'язку" для GLM


65

Яка різниця між термінами "функція зв'язку" та "канонічна функція зв'язку"? Також, чи є якісь (теоретичні) переваги використання одного над іншим?

Наприклад, бірна змінна відповідь може бути змодельована за допомогою багатьох функцій зв'язку, таких як logit , probit тощо. Але logit тут вважається "канонічною" функцією зв'язку.


10
Тут широко обговорюються функції посилань: різниця між моделями logit та probit , зосереджуючись на регресії для бінарної змінної відповіді. Хоча лише невелика частина цієї дискусії присвячена значенню того, що функція зв'язку є "канонічною", вона, тим не менш, може бути корисною для читання. Зауважимо, що для розуміння відмінності b / t & переваг функції канонічного від неканонічного зв'язку потрібно заглиблюватися в математику, що лежить в основі GLiM.
gung - Відновіть Моніку

Відповіді:


68

Наведені вище відповіді більш інтуїтивні, тому я стараюсь більш жорстко.

Що таке GLM?

Нехай позначає набір відповіді y і p -вимірний коваріатний вектор x = ( x 1 , , x p ) з очікуваним значенням E ( y ) = μ . Для i = 1 , ... , n незалежних спостережень, розподіл кожного y i - експоненціальна сім'я з щільністю f ( y i ;Y=(у,х)уpх=(х1,,хp)Е(у)=мкi=1,,нуi Тут параметр інтересу (природний або канонічний параметр) - θ i , ϕ - a параметр масштабу (відомий або сприймається як неприємність) і γ і τ - відомі функції. У п - мірні вектори фіксованих значень вхідних для р

f(уi;θi,ϕ)=досвід{[уiθi-γ(θi)]/ϕ+τ(уi,ϕ)}
θiϕγτнpпояснювальні змінні позначаються . Ми припускаємо, що вхідні вектори впливають (1) лише через лінійну функцію, лінійний предиктор, η i = β 0 + β 1 x i 1 + + β p x i p, від якої залежить θ i . Як можна показати, що θ = ( γ ) - 1 ( μ )х1,,хp
ηi=β0+β1хi1++βpхip
θiθ=(γ')-1(мк)ця залежність встановлюється з'єднанням лінійного предиктора та θ через середнє. Більш конкретно, середнє μ розглядається як зворотна і плавна функція лінійного предиктора, тобто g ( μ ) = η або μ = g - 1 ( η ) Тепер, щоб відповісти на ваше запитання:ηθмк
г(мк)=η або мк=г-1(η)

Функція називається функцією зв'язку. Якщо функція з'єднує μ , η і θ так, що η θ , то ця ланка називається канонічною і має вигляд g = ( γ ) - 1 .г()мкηθηθг=(γ')-1

Це воно. Тоді є ряд бажаних статистичних властивостей використання канонічної посилання, наприклад, достатньою статистикою є з компонентами i x i j y i для j = 1 , , p , методом Ньютона та оцінкою Фішера для знаходження Оцінювач ML збігається, ці посилання спрощують виведення MLE, вони гарантують, що деякі властивості лінійної регресії (наприклад, сума залишків дорівнює 0) зберігаються або вони забезпечують, що μ залишається в межах змінної результату.Х'уiхijуij=1,,pмк

Отже, вони, як правило, використовуються за замовчуванням. Однак зауважте, що немає апріорної причини, чому ефекти в моделі повинні бути адитивними за шкалою, заданою цим чи будь-яким іншим посиланням.


5
+1, це дуже приємна відповідь, @Momo. Деякі рівняння мені було важче прочитати, коли вони були поховані в абзацах, тому я "заблокував" їх за допомогою подвійних знаків долара (тобто $ $). Я сподіваюся, що це нормально (якщо ні, ви можете відкатати, не мої вибачення).
gung - Відновіть Моніку

1
@Momo, оригінальне питання тут, однак, включає те, про що Вей запитав, тому варто зазначити, що ще не було чітко відповіді.
Glen_b

1
θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)

1
. Звідси(γ'(θ)=π=ехp(θ)1+ехp(θ)(γ')-1(.)=logit (.)η=θг(.)θ=logit(π)=ηθηіснує лише, якщо ми використовуємо канонічну функцію зв'язку.
Druss2k

2
μθηθ

16

Гунг цитує гарне пояснення: канонічне посилання має особливі теоретичні властивості мінімальної достатності. Це означає, що ви можете визначити умовну модель логіту (яку економісти називають моделлю з фіксованим ефектом), обумовлюючи кількість результатів, але ви не можете визначити умовно-пробітну модель, оскільки не існує достатньої статистики для використання з пробіт-ланкою.


Чи можете ви трохи розібратися в питаннях мінімальної достатності? Наведеним вище поясненням ми все ще можемо визначити пробіт-модель, правда? Це точно не буде функцією канонічної посилання, але яка шкода від використання неканонічної функції посилання.
pikachuchameleon

9

Ось невеличка діаграма, натхненна класом MIT 18.650, який я вважаю досить корисним, оскільки допомагає візуалізувати зв’язки між цими функціями. Я використав те саме позначення, що і в дописі @ momo:

введіть тут опис зображення

  • γ(θ)
  • г(мк)

г

Діаграма дозволяє легко переходити з одного напрямку в інший, наприклад:

η=г(γ(θ))
θ=γ'-1(г-1(η))

Канонічна функція зв'язку

Інший спосіб вибору того, що Момо суворо описав, полягає в тому, що коли є канонічною функцією зв'язку, то склад функції γ - 1gг

γ-1г-1=(гγ')-1=Я
θ=η

1

Відповіді вище вже охоплювали те, що я хочу сказати. Просто для уточнення кількох моментів як дослідника машинного навчання:

  1. функція зв'язку - це не що інше, як обернення функції активації. Наприклад, логіт - це зворотна сигмоїда, пробіт - обернена функція кумулятивного розподілу Гаусса.

  2. шТхшх

Обговорення вище не має нічого спільного з експоненціальною сім'єю, але приємну дискусію можна знайти в книзі PRML Крістофера Бішопа. Розділ 4.3.6.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.