У вашому позначенні - проекція - це стовпчастий простір , тобто підпростір, що охоплює всі регресори. Тому - це проекція на все, ортогональне на підпростір, що охоплюється всіми регресорами.HXM:=In−H
Якщо , то сингулярно нормально розподіляється і елементи співвідносяться, як ви заявляєте.X∈Rn×ke^∈Rn
Помилки є неочевидними і в загальному випадку НЕ ортогональні підпростори , натягнутого на . Для аргументу припустимо, що помилка . Якби це було правдою, ми мали б з . Оскільки , ми можемо розкласти та отримати справжній .εXε⊥span(X)y=Xβ+ε=y~+εy~⊥εy~=Xβ∈span(X)yε
Припустимо , ми маємо базис з , де перший базисний вектор оболонка підпростір та решта span . Загалом, помилка матиме ненульові компоненти для . Цей ненульовий компонент буде змішуватися з і тому не може бути відновлений проекцією на .b1,…,bnRnb1,…,bkspan(X)bk+1,…,bnspan(X)⊥ε=α1b1+…+αnbnαii∈{1,…,k}Xβspan(X)
Оскільки ми ніколи не можемо сподіватися відновити справжні помилки та співвіднесені сингулярним розмірним нормальним, ми можемо перетворити . Там ми можемо мати, що
тобто - несингулярний некоррельований і гомоскедастичний нормальний розподілений. Нев'язки називаються BLUS залишки Theil в .εe^ne^∈Rn↦e∗∈Rn−k
e∗∼Nn−k(0,σ2In−k),
e∗e∗
У короткому документі Про тестування регресійних порушень нормальності ви знайдете порівняння залишків OLS та BLUS. У тестованому режимі Монте-Карло залишки OLS перевершують залишки BLUS. Але це повинно дати вам певну відправну точку.