Розглянемо просту ситуацію, коли у ваших даних немає коваріантної інформації. Скажімо, у вас просто спостереження .Y1,Y2,…,Yn∈R
Якщо ви використовуєте звичайний розподіл для моделювання своїх даних, ви, ймовірно, це напишете
Yi∼N(μ,σ2) ,
а потім спробуйте оцінити та , можливо, за максимальною оцінкою ймовірності.μσ
Скажімо, ваші дані - це підрахунок даних і, отже, не розповсюджується нормально. Цей випадок навіть не є безперервним, тому ви можете використовувати натомість розподіл Пуассона:
Yi∼Poisson(λ) .
Однак у вас тут є лише один параметр! Одиничний параметр визначає як середнє, так і дисперсійне через та . Це також відбувається, коли ви використовуєте Бернуллі або біноміальне розподіл. Але у вас можуть бути великі або менші розбіжності у ваших даних, можливо, тому, що спостереження не є справді ідентичними або ж вибране вами розповсюдження було недостатньо реалістичним.λE[Yi]=λVar[Yi]=λ
Тож люди додають параметр дисперсії, щоб отримати додатковий ступінь свободи в моделюванні середнього та дисперсії одночасно. Я думаю, що будь-який підручник з GLM дасть вам більш детальне та математичне пояснення, що це таке, але мотивація, я вважаю, досить проста.