Скільки дистрибутивів у GLM?


11

Я визначив декілька місць у підручниках, де ГЛМ описується 5 розподілами (а саме: Гамма, Гаусса, Біноміал, Зворотна Гаусса та Пуассона). Про це свідчить і сімейна функція у Р.

Інколи мені трапляються посилання на GLM, де додаткові дистрибутиви включаються ( приклад ). Чи може хтось пояснити, чому ці 5 є спеціальними або завжди є в GLM, але іноді інші?

З того, що я дізнався до цього часу, розподіли GLM в експоненціальній сім'ї всі вписуються у форму: де - параметр дисперсії, а - канонічний параметр.

f(y;θ,ϕ)=exp{yθb(θ)ϕ+c(y,ϕ)}
ϕθ

Чи не можна будь-який дистрибутив перетворити на пристосування до ГЛМ?


5
Зрозуміло, що рівномірний розподіл не належить до експоненціальної родини.
Zhanxiong

Приємне запитання. Наприклад, що з лонормальним?
Майкл М

1
@Zhanxiong, не є однорідним особливий випадок розподілу бета-версії, а бета-розподіл знаходиться в сім'ї експонентів?
shf8888

@ shf8888 AFAIK - це лише розподіл експоненціально-сімейних меж, коли він переходить до гамма-розподілу.
shadowtalker

@Zhanxiong, дякую за уточнення! Вибачте, ви праві, адже невідомі межі - це не експоненціальний розподіл сім'ї.
shf8888

Відповіді:


4

Як ви вказуєте, кваліфікація використання дистрибутива в GLM полягає в тому, що він має експоненціальну родину (зверніть увагу: це не те саме, що експоненціальне розподіл! Хоча експоненціальний розподіл, як розподіл гами, сам є частиною експоненціальна сім'я). П’ять дистрибутивів, які ви перераховуєте, є усіма цією родиною, і що ще важливіше, це ДУЖЕ поширені розподіли, тому вони використовуються як приклади та пояснення.

Як зазначає Жансіонг, рівномірний розподіл (з невідомими межами) є класичним прикладом неекспоненціального розподілу сім'ї. shf8888 плутає загальний рівномірний розподіл на будь-якому проміжку з Уніформою (0, 1). Уніфікований (0,1) розподіл - це особливий випадок бета-розподілу, який є експоненціальним сімейством. Інші неекспоненціальні розподіли сімей є моделями суміші та розподілом t.

Ви маєте визначення правильної родини експонентів, і канонічний параметр дуже важливий для використання GLM. Тим не менш, мені завжди було легше зрозуміти експоненціальну сім'ю, записавши її як:

f(x;θ)=a(θ)g(x)exp[b(θ)R(x)]

Існує більш загальний спосіб написання цього з вектором замість скалярного ; але одновимірний випадок пояснює багато. Зокрема, ви повинні мати змогу розподілити неекспоненційну частину вашої щільності на дві функції: одну з невідомого параметра але не спостережувані дані та одну з а не ; те ж саме для експонентної частини. Може бути важко зрозуміти, як, наприклад, біноміальний розподіл можна записати таким чином; але з деяким алгебраїчним жонглюванням це з часом стає зрозумілим.θθθxxθ

Ми використовуємо експоненціальну сім'ю, оскільки це робить багато речей набагато простішими: наприклад, пошук достатньої статистики та тестування гіпотез. У GLM канонічний параметр часто використовується для пошуку функції зв'язку. Нарешті, пов'язана ілюстрація того, чому статистики вважають за краще використовувати експоненціальну сім'ю майже у кожному випадку, намагається зробити будь-який класичний статистичний висновок щодо, скажімо, єдиного ( , ) розподілу, де і і невідомі . Це не неможливо, але це набагато складніше та залучене, ніж робити те ж саме для експоненціальних розподілів сім'ї.θ1θ2θ1θ2


Бета-розподіл з обома невідомими параметрами все ще є експоненціальним сімейством (але 2-параметричне експоненціальне сімейство). Що змушує вас думати, що це не так? www2.stat.duke.edu/courses/Spring11/sta114/lec/… або wikipedia
DavidR

Дякую, що вказали на це, я змінив свій коментар ... ви маєте рацію! Я дійсно не знаю, що я мав на увазі
Генрі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.