Відповідь вище мене трохи збентежив, отже, я ще раз спробую. Я думаю, що питання насправді не про «класичну» лінійну регресію, а про стиль цього конкретного джерела. Про класичну регресійну частину:
Однак припущення про лінійність саме по собі не наводить жодної структури нашої моделі
Це абсолютно правильно. Як ви вже заявляли, може також знищити лінійне відношення і скласти щось абсолютно незалежне від щоб ми взагалі не змогли обчислити жодну модель.ϵX
Хіба Грін неохайно? Чи повинен він насправді записати:E(y|X)=Xβ
Я не хочу відповідати на перше запитання, але дозвольте підсумувати припущення, необхідні для звичайної лінійної регресії:
Припустимо, що ви спостерігаєте (вам дано) точки даних та для . Вам потрібно припустити, що дані ви спостерігали, походять від незалежно однаково розподілених випадкових змінних таких, що ...xi∈Rdyi∈Ri=1,...,n(xi,yi)(Xi,Yi)
Існує фіксований (незалежний від ) такий, що для всіх а випадкові змінні такі, щоiβ∈RdYi=βXi+ϵiiϵi
є IID , а також і поширюється як ( повинні бути незалежні від , а)ϵiϵiN(0,σ)σi
Для і змінні мають загальну щільність, тобто одна випадкова величина має щільністьX=(X1,...,Xn)Y=(Y1,...,Yn)X,Y(X,Y)fX,Y
Тепер ви можете бігти по звичайному шляху і обчислювати
fY|X(y|x)=fY,X(y,x)/fX(x)=(12πd−−−√)nexp(−∑ni=1(yi−βxi)22σ)
так що завдяки звичайній 'подвійності' між машинним навчанням (мінімізація функцій помилок) та теорією ймовірностей (максимізація ймовірностей) ви максимізуєте в що насправді дає вам звичайні речі "RMSE".β−logfY|X(y|x)β
Тепер, як сказано: Якщо автор книги, яку ви цитуєте, хоче зробити це (якщо ви хочете коли-небудь мати можливість обчислити "найкращу" регресійну лінію в базовій установці), то так, він повинен зробіть це припущення щодо нормальності десь у книзі.ϵ
Зараз є різні можливості:
Він не припускає цього припущення у книзі. Тоді це помилка в книзі.
Він записує це у вигляді "глобального" зауваження на кшталт "коли я пишу тоді звичайно розподіляється із середнім нулем, якщо не вказано інше". Тоді ІМХО - це поганий стиль, оскільки він викликає саме плутанину, яку ти відчуваєш зараз. Тому я схильний писати припущення в укороченому вигляді в кожній теоремі. Тільки тоді кожен будівельний блок можна розглядати чисто по-своєму.+ϵϵ
- Він записує це впритул до тієї частини, яку ви цитуєте, і ви / ми просто не помітили цього (також можливість :-))
Однак, також у суворому математичному сенсі, звичайна помилка є чимось канонічним (розподіл із найвищою ентропією [як тільки буде виправлена дисперсія], отже, створюючи найсильніші моделі), так що деякі автори прагнуть пропустити це припущення, але, тим не менш, використовують. . Формально ви абсолютно праві: вони використовують математику «неправильно». Всякий раз, коли вони хочуть придумати рівняння для щільності як зазначено вище, тоді вони повинні знати досить добре, інакше у вас просто є властивості його пролітати навколо у кожному розумному рівнянні, яке ви намагаєтесь записати . ϵfY|Xϵ