Лінійна регресія: будь-який ненормальний розподіл, що дає тотожність OLS та MLE?


13

Це питання викликане довгим обговоренням у коментарях тут: Як лінійна регресія використовує нормальний розподіл?

У звичайній лінійної регресійної моделі, для простоти тут написана тільки один провісник:

Yi=β0+β1xi+ϵi
, де xi відомі константи і & ϵi дорівнюють нулю, середні незалежні вектори помилок. Якщо ми, крім того, припустимо нормальні розподіли для помилок, то звичайні оцінювачі найменших квадратів та максимальна оцінка ймовірності β0,β1 однакові.

Тож моє легке запитання: чи існує якийсь інший розподіл для термінів помилки, щоб млека були ідентичними звичайному оцінювачу найменших квадратів? Одне значення легко показати, інше - не так.


1
(+1) Це повинно бути розподілом, орієнтованим навколо нуля, і, здавалося б, це допоможе, якби це було симетричним. Деякі кандидати, які приходять на розум, наприклад, t- чи розподіл Лапласа, схоже, не виконують трюк, оскільки MLE, навіть у постійному єдиному випадку, недоступний у закритому вигляді або наданий відповідно медіаною.
Крістоф Хенк

дивіться також stats.stackexchange.com/questions/99014/… , здається, є лише стільки, щоб знайти
Крістоф Ханк

Я впевнений, що відповідь - ні. Однак, важко написати жорсткий доказ.
Гордон Сміт

Відповіді:


11

За максимальною оцінкою ймовірності ми проводимо розрахунок

β^ML:lnf(ϵi)β=0f(ϵi)f(ϵi)xi=0

останнє відношення з урахуванням структури лінійності рівняння регресії.

Для порівняння, оцінювач OLS задовольняє

ϵixi=0

Для отримання однакових алгебраїчних виразів для коефіцієнтів нахилу нам потрібно мати щільність для терміна помилки, що

f(ϵi)f(ϵi)=±cϵif(ϵi)=±cϵif(ϵi)

Це диференційні рівняння виду y=±xy які мають рішення

1ydy=±xdxlny=±12x2

y=f(ϵ)=exp{±12cϵ2}

Будь-яка функція, яка має це ядро ​​та інтегрується до єдності над відповідним доменом, зробить MLE та OLS для коефіцієнтів нахилу однаковими. А саме ми шукаємо

g(x)=Aexp{±12cx2}:abg(x)dx=1

Чи є така g який не є нормальною щільністю (або напів нормальною чи похідною функції помилки)?

Звичайно. Але ще одна річ, яку слід враховувати, полягає в наступному: якщо використовується знак плюс в експоненті і, наприклад, симетрична підтримка навколо нуля, вийде щільність, яка має унікальний мінімум в середині, і два локальні максимуми в межі опори.


Чудова відповідь (+1), але якщо в функції використовується знак плюс, це навіть щільність? Тоді може здатися, що функція має нескінченний інтеграл і тому не може бути нормалізована до функції щільності. Якщо це так, нам залишається лише нормальний розподіл.
Бен - Відновити Моніку

1
@Бен Дякую Здається, ви неявно припускаєте, що діапазон випадкової величини буде плюс / мінус нескінченності. Але ми можемо визначити rv для діапазону в обмеженому інтервалі, і в цьому випадку ми можемо дуже добре використовувати знак плюс. Ось чому в своїх виразах я використовував як межі інтеграції . (a,b)
Алекос Пападопулос

Це правда - я припускав це.
Бен - Відновлення Моніки

5

argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)
argβ0,β1mini=1nlog{f(yi|xi,β0,β1)}=argβ0,β1mini=1n(yiβ0β1xi)2
прийнятно. Це означає, наприклад, що щільність форми
f(y|x,β0,β1)=f0(y|x)exp{ω(yiβ0β1xi)2}
є прийнятними оскільки чинникf0(y|x)(β0,β1)

Інша установка, де обидва оцінки оцінюються, коли дані надходять із сферично симетричного розподілу , а саме коли (векторні) дані мають умовну щільність при спадна функція. (У цьому випадку OLS все ще доступний, хоча припущення про незалежність має місце лише у звичайному випадку.) h ( | | y - X β | | ) h ( ) ϵ iy

h(||yXβ||)
h()ϵi

1
Для мене це не виглядає правильно. Якщо ви використовуєте інше сферично-симетричне розподіл, чи не призведе це до мінімізації іншої функції норми, ніж квадрат (таким чином, не найменшим значенням квадратів)?
Бен - Відновлення Моніки

1

Я не знав про це питання, поки @ Xi'an тільки не оновив відповідь. Є більш загальне рішення. Експоненціальні розподіли сімей з деякими параметрами фіксували вихід на розбіжності Брегмана. Для таких розподілів мається на увазі мінімізатор. OLS-мінімізатор також є середнім. Тому для всіх таких розподілів вони повинні збігатися, коли лінійний функціонал пов'язаний із середнім параметром.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf

введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.