Чому кореляція залишків не має значення при тестуванні на нормальність?


9

Коли (тобто походить від лінійної регресійної моделі), і в цьому випадку залишки співвідносні і не є незалежними. Але коли ми робимо регресійну діагностику і хочемо перевірити припущення , кожен підручник пропонує використовувати графіки Q – Q та статистичні тести на залишки які були розроблені для перевірки, чи для деяких .Y=AX+εY

εN(0,σ2I)e^=(IH)YN(0,(IH)σ2)
e^1,,e^nεN(0,σ2I)e^e^N(0,σ2I)σ2R

Чому для цих тестів не має значення, що залишки співвідносяться і не є незалежними? Часто пропонується використовувати стандартизовані залишки: але це лише робить їх однорідними, а не незалежними.

e^i=e^i1hii,

Для переформулювання питання: Залишки від регресії OLS співвідносяться. Я розумію, що на практиці ці кореляції настільки малі (більшість часу? Завжди?), Що їх можна ігнорувати, перевіряючи, чи залишилися залишки від нормального розповсюдження. Моє питання: чому?


1
Робить їх однорідними.
Scortchi

1
Ви запитуєте про застосовність цих тестів, коли залишки мають сильні кореляції чи вас просто турбує (дуже незначна та невпливова) негативна кореляція, що виникає в результаті процедури оцінки найменших квадратів?
whuber

1
@whuber Я запитую про співвідношення, що виникає в результаті процедури оцінки найменших квадратів. Якщо вони незначні та несуттєві, я хотів би знати чому.
Зоран Лонкаревич

Відповіді:


3

У вашому позначенні - проекція - це стовпчастий простір , тобто підпростір, що охоплює всі регресори. Тому - це проекція на все, ортогональне на підпростір, що охоплюється всіми регресорами.HXM:=InH

Якщо , то сингулярно нормально розподіляється і елементи співвідносяться, як ви заявляєте.XRn×ke^Rn

Помилки є неочевидними і в загальному випадку НЕ ортогональні підпростори , натягнутого на . Для аргументу припустимо, що помилка . Якби це було правдою, ми мали б з . Оскільки , ми можемо розкласти та отримати справжній .εXεspan(X)y=Xβ+ε=y~+εy~εy~=Xβspan(X)yε

Припустимо , ми маємо базис з , де перший базисний вектор оболонка підпростір та решта span . Загалом, помилка матиме ненульові компоненти для . Цей ненульовий компонент буде змішуватися з і тому не може бути відновлений проекцією на .b1,,bnRnb1,,bkspan(X)bk+1,,bnspan(X)ε=α1b1++αnbnαii{1,,k}Xβspan(X)

Оскільки ми ніколи не можемо сподіватися відновити справжні помилки та співвіднесені сингулярним розмірним нормальним, ми можемо перетворити . Там ми можемо мати, що тобто - несингулярний некоррельований і гомоскедастичний нормальний розподілений. Нев'язки називаються BLUS залишки Theil в .εe^ne^RneRnk

eNnk(0,σ2Ink),
ee

У короткому документі Про тестування регресійних порушень нормальності ви знайдете порівняння залишків OLS та BLUS. У тестованому режимі Монте-Карло залишки OLS перевершують залишки BLUS. Але це повинно дати вам певну відправну точку.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.