Як ви вказуєте, кваліфікація використання дистрибутива в GLM полягає в тому, що він має експоненціальну родину (зверніть увагу: це не те саме, що експоненціальне розподіл! Хоча експоненціальний розподіл, як розподіл гами, сам є частиною експоненціальна сім'я). П’ять дистрибутивів, які ви перераховуєте, є усіма цією родиною, і що ще важливіше, це ДУЖЕ поширені розподіли, тому вони використовуються як приклади та пояснення.
Як зазначає Жансіонг, рівномірний розподіл (з невідомими межами) є класичним прикладом неекспоненціального розподілу сім'ї. shf8888 плутає загальний рівномірний розподіл на будь-якому проміжку з Уніформою (0, 1). Уніфікований (0,1) розподіл - це особливий випадок бета-розподілу, який є експоненціальним сімейством. Інші неекспоненціальні розподіли сімей є моделями суміші та розподілом t.
Ви маєте визначення правильної родини експонентів, і канонічний параметр дуже важливий для використання GLM. Тим не менш, мені завжди було легше зрозуміти експоненціальну сім'ю, записавши її як:
f(x;θ)=a(θ)g(x)exp[b(θ)R(x)]
Існує більш загальний спосіб написання цього з вектором замість скалярного ; але одновимірний випадок пояснює багато. Зокрема, ви повинні мати змогу розподілити неекспоненційну частину вашої щільності на дві функції: одну з невідомого параметра але не спостережувані дані та одну з а не ; те ж саме для експонентної частини. Може бути важко зрозуміти, як, наприклад, біноміальний розподіл можна записати таким чином; але з деяким алгебраїчним жонглюванням це з часом стає зрозумілим.θθθxxθ
Ми використовуємо експоненціальну сім'ю, оскільки це робить багато речей набагато простішими: наприклад, пошук достатньої статистики та тестування гіпотез. У GLM канонічний параметр часто використовується для пошуку функції зв'язку. Нарешті, пов'язана ілюстрація того, чому статистики вважають за краще використовувати експоненціальну сім'ю майже у кожному випадку, намагається зробити будь-який класичний статистичний висновок щодо, скажімо, єдиного ( , ) розподілу, де і і невідомі . Це не неможливо, але це набагато складніше та залучене, ніж робити те ж саме для експоненціальних розподілів сім'ї.θ1θ2θ1θ2