Зв'язок між MLE та найменшими квадратами у випадку лінійної регресії


9

Хасті та Тібшірані згадують у розділі 4.3.2 своєї книги, що у лінійній регресії підхід найменших квадратів насправді є особливим випадком максимальної вірогідності. Як ми можемо довести цей результат?

PS: Не шкодуйте математичних деталей.


2
Це не окремий випадок: вони просто ідентичні, коли розподіл помилок є нормальним.
Zhanxiong

Відповіді:


13

Модель лінійної регресії

Y=Xβ+ϵ, де ϵN(0,Яσ2)

YRн, ХRн×p і βRp

Зауважте, що помилка нашої моделі (залишкова) є ϵ=Y-Хβ. Наша мета - знайти векторβs, які мінімізують L2 норма цієї квадратичної помилки.

Найменші квадрати

Наведені дані (х1,у1),...,(хн,ун) де кожен хi є p розмірними, ми прагнемо знайти:

β^LS=аргмінβ||ϵ||2=аргмінβ||Y-Хβ||2=аргмінβi=1н(уi-хiβ)2

Максимальна ймовірність

За допомогою наведеної вище моделі ми можемо встановити ймовірність даних, заданих параметрами β як:

L(Y|Х,β)=i=1нf(уi|хi,β)

де f(уi|хi,β) - pdf звичайного розподілу із середнім значенням 0 та дисперсією σ2. Підключіть його:

L(Y|Х,β)=i=1н12πσ2е-(уi-хiβ)22σ2

Зараз, як правило, якщо мати справу з вірогідністю, математично простіше взяти журнал перед тим, як продовжувати (продукти стають сумми, експоненти відходять), так що давайте це зробимо.

журналL(Y|Х,β)=i=1нжурнал(12πσ2)-(уi-хiβ)22σ2

Оскільки ми хочемо оцінити максимальну ймовірність, ми хочемо знайти максимум рівняння, яке було зазначено вище, стосовно β. Перший термін не впливає на нашу оцінкуβ, тому ми можемо ігнорувати це:

β^МLЕ=аргмаксβi=1н-(уi-хiβ)22σ2

Зауважте, що знаменник є константою відносно β. Нарешті, зауважте, що перед сумою є негативний знак. Тож знаходження максимуму від’ємного числа - це як знаходження мінімуму без негативного. Іншими словами:

β^МLЕ=аргмінβi=1н(уi-хiβ)2=β^LS

Нагадаємо, що для цього нам довелося зробити певні припущення щодо моделі (нормальність термінів помилки, 0 середнє значення, постійна дисперсія). Це робить найменше квадратів еквівалентним MLE за певних умов. Дивіться тут і тут для більшого обговорення.

Для повноти зауважте, що рішення можна записати так:

β=(ХТХ)-1ХТу
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.