Припущення щодо регресійного залишкового розподілу


12

Чому необхідно розміщувати припущення про розподіл на помилках, тобто

yi=Xβ+ϵi , приϵiN(0,σ2) .

Чому б не написати

yi=Xβ+ϵi зyiN(Xβ^,σ2) ,

де в будь-якому випадку ϵi=yiy^ .
Я бачив, як підкреслювалося, що припущення щодо поширення розміщуються на помилках, а не на даних, але без пояснень.

Я не дуже розумію різницю між цими двома рецептурами. У деяких місцях я бачу, що припущення щодо розподілу розміщуються на даних (байєсівська освітленість, здається, в основному), але в більшості випадків припущення розміщуються на помилках.

При моделюванні, чому б / слід вибрати для початку припущення про те чи інше?


По-перше, це не "потрібно", це залежить, що ви маєте намір робити. Є кілька хороших відповідей, але я думаю, що суть є основним припущенням причинності, в сенсі Xs "викликає" y, і якщо ви дивитесь на це таким чином, ви бачите, що розподіл y "викликається" розподіл резус, що означає Xs та помилки (якщо такі є). Можна робити велику економетрику з дуже обмеженими припущеннями щодо розподілу і, зокрема, без нормальності. Дякую, Боже.
PatrickT

3
НЕХβ, а середнє населенняу«S не збігається з оцінкою зразка цього. Який повинен сказатищо друга річнасправді не те ж саме, що і перший, але якщо ви заміните його з очікуванням (Е( у )=Е(у)=Xβ), то два будуть еквівалентні. y^XβyE(y^)=E(y)=Xβ
Glen_b -Встановити Моніку

Що у ? І якщо y i змінюється в залежності від i , чому X β не змінюється? Будь ласка, придумайте, які позначення ви хочете використовувати, вектор чи матрицю. Тепер , якщо ми припустимо , що у = X β ваші позначення більш Bizzare: у я ~ N ( х ' я ( Σ х J х ' J ) - 1 Σ х J у J , сг 2 )y^yiiXβy^=Xβ^yiN(xi(xjxj)1xjyj,σ2), тобто ви визначаєте розподіл з точки зору самого себе та всіх інших спостережень y j ! yiyj
mpiktas

1
Я спростував це питання, тому що вважаю, що позначення є заплутаними, і це вже призвело до декількох тонко суперечливих відповідей.
mpiktas

Відповіді:


9

У налаштуваннях лінійної регресії прийнято робити аналіз і отримувати результати, що обумовлюються , тобто умовними "даними". Таким чином, то , що вам потрібно , що у | X нормально, тобто, що вам потрібно & epsi бути нормальним. Як показано на прикладі Пітера Флома, можна мати нормальність ϵ, не маючи нормальності y , і, отже, оскільки те, що вам потрібно, це нормальність ϵ , це розумне припущення.XyXϵϵyϵ


9

Я би написав друге визначення як

yiN(Xiβ,σ2)

або (як пропонує Карл Оскар +1)

yi|XiN(Xiβ,σ2)

σ2yiXi

ϵiy^


3

Різницю найлегше проілюструвати на прикладі. Ось простий:

Припустимо, Y є бімодальним, при цьому модальність враховується незалежною змінною. Наприклад, Y - це зріст, і ваш зразок (з будь-якої причини) складається з жокеїв та баскетболістів. наприклад вR

set.seed(123)
tall <- rnorm(100, 78, 3)
short <- rnorm(100, 60, 3)

height <- c(tall, short)
sport <- c(rep("B", 100), rep("H",100))

plot(density(height))

m1 <- lm(height~sport)
plot(m1)

перша щільність дуже ненормальна. Але залишки від моделі надзвичайно близькі до норми.

Щодо того, чому обмеження розміщені таким чином - я дозволю комусь іншому відповісти на це.


1
yiϵi

У такому випадку гетероскедастичність буде проблемою, і вам потрібно буде використовувати якусь іншу форму регресії, або, можливо, якусь трансформацію, або ви можете додати іншу змінну (у цьому дурному прикладі позиція, яка грається в баскетболі, може це зробити).
Пітер Флом - Відновіть Моніку

Я не впевнений, що формулювання має на меті припустити, що ys нормально розподілені, тільки що вони мають нормальний умовний розподіл.
Дікран Марсупіал

2


yiN(y^i,σε2)
y^xi

y^ixiβ^

yiN(xiβ^,σε2)

E[xiβ^]=E[xiβ^+E[N(0,σε2)]]=E[xiβ^+0]=E[xiβ^]
(І очевидно, що відхилення рівні.) Іншими словами, це не різниця в припущеннях, а просто нотаційна різниця.

Тож виникає питання, чи є причина віддати перевагу презентації ідеї за допомогою першої рецептури?

Я думаю, що відповідь " так" з двох причин:

  1. Люди часто плутають, чи слід нормально поширювати необроблені дані (тобто ), чи дані, що залежать від /, помилки мають бути нормально розповсюджені (тобто / ), наприклад, див. : Що робити, якщо залишки зазвичай розподіляються, але у ні?YXY|Xε
  2. Люди також часто плутають те, що повинно бути незалежним, необроблені дані або помилки. Більше того, ми часто згадуємо той факт, що щось має бути ідентичним (незалежним і однаково розподіленим); якщо ви думаєте з точки зору це може бути ще одним потенційним джерелом плутанини, оскільки може бути незалежним, але не може бути ідентично розподіленим, якщо не дотримується нульової гіпотези (тому що середнє значення буде різним). Y | ХY|XY|X

Я вважаю, що ці плутанини скоріше використовують другий склад, ніж перший.


1
@Glen_b, я не стежу за вашим коментарем. Моє твердження не в тому, що дорівнює , а в тому, що дорівнює . Підписане індексація спостережень є релевантним. Ідея полягає в тому, що передбачуване значення для даного спостереження є . Це не має нічого спільного з значенням серед населення . (Здається, я забув додати капелюхи до бета-версій; хоча це я вже виправив.) Хβ у яхя β я у яхя β Yy^Xβy^ixiβ^iy^ixiβ^Y
gung - Відновити Моніку

@Glen_b якби зразок означав, що це буде а не . Я спочатку вважав, що позначення також заплутане, але той факт, що випливає з тверджень, що і . Щоб обидва ці речі були правдивими, може бути лише . у у =Хβуя=Хβ+εяεя=уя - у у Хβy¯y^y^=Xβyi=Xβ+ϵiϵi=yiy^y^Xβ
Дікран Марсупіал
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.