Яке значення має матриця капелюхів, , в лінійній регресії?


10

Яке значення має матриця капелюхів, , в регресійному аналізі?H=X(XX)1X

Це тільки для більш легкого розрахунку?


Також, чи можете ви бути більш конкретними?
Steve S

@SteveS Насправді я хочу знати, для чого нам потрібна матриця капелюхів?
користувач 31466

Ви запитуєте, чому нам потрібно мати спеціальну назву / символ (тобто "капелюшна матриця", " H ") для матриці, або ви більше запитуєте про важливість матричного продукту праворуч?
Steve S

Відповіді:


14

При вивченні лінійної регресії основним початковим моментом є процес генерації даних де та детермінований. Після мінімізації критерію найменших квадратів знайдемо оцінювач для , тобто . Після підключення оцінки до початкової формули ви отримуєте як лінійну модель процесу генерації даних. Тепер оцінювач можна замінити наy= XB + uuN(0,σ2I)XB^BB^=(XX)1Xyy^=XB^B^і отримуєy^=X(XX)1Xy.

Отже, - насправді матриця проекції. Уявіть, що ви приймаєте всі змінні в . Змінні - це вектори і охоплюють пробіл. Отже, якщо ви помножите на , ви запроектуєте спостережувані значення в на простір, який охоплюється змінними в . Він дає оцінку для і саме тому його називають матрицею капелюхів і чому він має таке значення. Зрештою, лінійна регресія - це не що інше, як проекція, і за допомогою матриці проекції ми не можемо лише обчислити оцінки дляH=X(XX)1XXHyyXyyале також для і, наприклад, може перевірити, чи дійсно він нормально розподілений.u

Я знайшов цю приємну картину в Інтернеті, і вона візуалізує цю проекцію. Зауважте, що використовується замість . Більше того, малюнок підкреслює, що вектор термінів помилки є ортогональним проекції і, отже, не співвідноситься з оцінками дляβBy

введіть тут опис зображення


5

Матриця капелюхів дуже корисна з кількох причин:

  1. Замість того, щоб мати , ми отримуємо це де - матриця капелюхів. Це дає нам що є лінійним відображенням спостережуваних значень.y^=Zβ^y^=PyPy^
  2. З матриці капелюхів легко обчислити залишки . Ми бачимо, що .Pϵ^ϵ^=yy^=yPy=(InP)y

0

Це не що інше, як знайти «найближче» рішення для Ax = b, де b не знаходиться в просторі стовпців. Ми проектуємо b на простір стовпців і вирішуємо для Ax (hat) = p, де p - проекція b на простір стовпців.


1
Все це може бути зроблено без коли - або обчислення . H
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.