Чому RSS розподіляється чі квадратним часом np?


28

Я хотів би зрозуміти, чому в моделі OLS розподіляється RSS (залишкова сума квадратів) ( - кількість параметрів у моделі, кількість спостережень).

χ2(np)
pn

Прошу вибачення за те, що я задав таке основне запитання, але, здається, я не в змозі знайти відповідь в Інтернеті (або в моїх, більш орієнтованих на додатків, підручниках).


3
Зауважте, що відповіді демонструють твердження не зовсім правильно: розподіл RSS - це (не ) разів де - справжня дисперсія помилок. σ2npχ2(np)σ2
whuber

Відповіді:


36

Я вважаю таку лінійну модель: .y=Xβ+ϵ

Вектор залишків оцінюється за

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ

де .Q=IX(XX)1X

Зауважте, що (слід є інваріантним при циклічній перестановці) і що . Таким чином, власними значеннями Q є 0 та 1 (деякі деталі нижче). Отже, існує унітарна матриця V така, що ( матриці діагоналізуються унітарними матрицями тоді і лише тоді, коли вони є нормальними. )tr(Q)=npQ=Q=Q2Q01V

VQV=Δ=diag(1,,1np times,0,,0p times)

Тепер нехай .K=Vϵ^

Оскільки , ми маємо і тому . Таким чиномϵ^N(0,σ2Q)KN(0,σ2Δ)Knp+1==Kn=0

K2σ2=K2σ2χnp2

з .K=(K1,,Knp)

Далі, оскільки - це унітарна матриця, ми також маємоV

ϵ^2=K2=K2

Таким чином

RSSσ2χnp2

Нарешті, зауважте, що цей результат означає це

E(RSSnp)=σ2

Так , то мінімальний многочлен з ділить многочлен . Отже, власні значення належать до числа і . Оскільки також є сумою власних значень, помножених на їх кратність, ми обов'язково маємо, що - власне значення з кратністю а нуль - власне значення з кратністю .Q2Q=0Qz2zQ01tr(Q)=np1npp


1
(+1) Гарна відповідь. Можна обмежити увагу на ортогональних, а не на одиничних, оскільки справжній та симетричний. Також, що таке ? Я не вважаю це визначеним. Трохи повторюючи аргумент, можна також уникнути використання виродженої норми у випадку, якщо це викликає деяке занепокоєння у тих, хто її не знає. VQSCR
кардинал

2
@Cardinal. Влучне зауваження. SCR ("Somme des Carrés Résiduels" французькою мовою) повинен був бути RSS.
окрам

Дякую за детальну відповідь Ocram! Деякі кроки вимагають від мене більшого вигляду, але я маю намір обміркувати зараз - дякую!
Тал Галілі

@Glen_b: О, я змінив пару днів тому, щоб змінити SCR на SRR. Я не пам’ятав, що в моєму коментарі згадується SCR. Вибачте за непорозуміння.
ocram

@Glen_b: Це мало означати RSS: -S Відредаговано ще раз. Thx
ocram

9

ІМХО, матричне позначення ускладнює речі. Чиста мова векторного простору є чистішою. Модель може бути записана де має стандартний нормальний розподіл на і вважається, що належить до векторного підпростору .Y=Xβ+ϵY=μ+σGGRnμWRn

Тепер мова елементарної геометрії вступає в гру. Оцінювач найменших квадратів of - це не що інше, як : ортогональна проекція спостережуваного на простір якому належить вважати . Вектор невязок є : проекція на ортогональное доповнення з в . Розмір дорівнює .μ^μPWYYWμPWYWWRnWdim(W)=ndim(W)

Нарешті, і має стандартний нормальний розподіл на , отже, його норма в квадраті має розподіл зі ступенями свободи .

PWY=PW(μ+σG)=0+σPWG,
PWGWχ2dim(W)

Ця демонстрація використовує лише одну теорему, фактично теорему визначення:

Визначення і теорема . Випадковий вектор у має стандартний нормальний розподіл у векторному просторі якщо він приймає значення у та його координати в одній ( у всіх) ортонормальній основі з є незалежними одномірні стандартні нормальні розподілуRnURnUU

(з цієї визначення-теореми теорема Кокрана настільки очевидна, що її не варто заявляти)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.