Як можна довести, що нормальні рівняння: мають один чи більше розв’язків без припущення, що X є незворотним?
Єдина моя здогадка - це щось спільне з узагальненим зворотним, але я повністю втрачений.
Як можна довести, що нормальні рівняння: мають один чи більше розв’язків без припущення, що X є незворотним?
Єдина моя здогадка - це щось спільне з узагальненим зворотним, але я повністю втрачений.
Відповіді:
Можна спокуситись глібом і зазначити це тому, що квадратична форма
є позитивним напіввизначеним, існує для якого він мінімальний, і цей мінімум знайдений (встановивши градієнт відносно β до нуля) з нормальними рівняннями
звідки має бути принаймні одне рішення , незалежно від рангу . Однак, здається, цей аргумент не відповідає духу питання, який, як видається, є суто алгебраїчним твердженням. Можливо, цікаво зрозуміти, чому таке рівняння повинно мати рішення та за яких саме умов. Тож почнемо спочатку і зробимо вигляд, що ми не знаємо зв’язку з найменшими квадратами.
Це все зводиться до значення , транспонованою X . Це виявиться питанням простого визначення, відповідного позначення та концепції невідродженої напівлінійної форми. Нагадаємо, що X - "матриця проектування" з n рядків (по одному для кожного спостереження) та p стовпців (по одній для кожної змінної, включаючи постійну, якщо така є). Отже, це являє собою лінійне перетворення з векторного простору V = R p в W = R n .
Транспонування , що розглядається як лінійне перетворення , є лінійним перетворенням подвійних просторів X ′ : W ∗ → V ∗ . Для того , щоб мати сенс композиції , як X ' X , то необхідно визначити W * з W . Це те, що звичайне скалярний твір (сума квадратів) на W робить.
Насправді є два внутрішні добутки і g W, визначені на V і W відповідно. Це дійсні значення білінеарних симетричних функцій, які не вироджуються . Останнє означає, що
з аналогічною звітністю за . Геометрично ці внутрішні вироби дозволяють нам вимірювати довжину та кут. Умова г ( U , V ) = 0 можна розглядати як у будучи «перпендикулярно» до V . Невиродженість означає, що тільки нульовий вектор перпендикулярний до всього векторного простору. (Ця спільність означає , що отримані тут результати будуть застосовуватися до узагальненим методом найменших квадратів , що встановлюють, для яких г W не обов'язково звичайне скалярний твір дається як сума добутків компонент, але деяка довільна невироджених форма. Ми могли б обійтися без г взагалі, визначаючи X ′ : W → V ∗ , але я очікую, що багато читачів будуть незнайомими або незручними з подвійними пробілами, і тому вирішують уникати цієї формулювання.)
З цими внутрішніми продуктами в русі перенесення будь-якого лінійного перетворення визначається X ' : W → V через
для всіх і про ∈ V . Що існує насправді вектор X ′ ( w ) ∈ V з цією властивістю, можна встановити, виписавши речі з підстав для V і W ; що цей вектор унікальний випливає з не виродженості внутрішніх продуктів. Бо якщо v 1 і v 2 - два вектори, для яких g V ( v 1 , v ) = g V ( v 2 , v для всіх v ∈ V , тоді (від лінійності в першому компоненті) g V ( v 1 - v 2 , v ) = 0 для всіх v, що означає v 1 - v 2 = 0 .
Коли запис U ⊥ для безлічі всіх векторів , перпендикулярних до кожного вектору в U . Крім того, напишіть X ( V ) для зображення X , визначеного як множина { X ( v ) | v ∈ V } ⊂ W . Фундаментальне співвідношення між X та його транспонтом X ' є
Тобто, знаходиться в ядрі X ' тоді і тільки тоді , коли ш перпендикулярно до образу X . Це твердження говорить про дві речі:
Якщо , то g W ( w , X ( v ) ) = g V ( X ′ ( w ) , v ) = g V ( 0 , v ) = 0 для всіх v ∈ V , що просто означає, що w перпендикулярно до X ( V ) .
Якщо перпендикулярно X ( V ) , це означає лише g W ( w , X ( v ) ) = 0 для всіх v ∈ V , але це еквівалентно g V ( X ′ ( w ) , v ) = 0 і не виродженість g V означає X ′ ( w ) = 0 .
Ми фактично закінчили зараз. Аналіз показав, що розкладається як прямий добуток W = X ( V ) ⊕ X ( V ) ⊥ . Тобто, ми можемо взяти будь-який довільний y ∈ W і записати його однозначно як y = y 0 + y ⊥ з y 0 ∈ X ( V ) і y ⊥ ∈ X ( V ) ⊥ . Це означає, що y 0 має вигляд принаймні один & beta ; ∈ V . Зверніть увагу, що
Фундаментальне співвідношення говорить, що те саме, що ліва сторона знаходиться в ядрі :
Один цікавий результат цієї абстрактної алгебраїчної демонстрації - це те, що ми можемо розв’язати нормальні рівняння у довільних векторних просторах. Результат справедливий, скажімо, для складних просторів, для просторів над кінцевими полями (де мінімізація суми квадратів має мало сенсу), і навіть над нескінченномірними просторами, які підтримують відповідні послідовні форми.
У типовій регресії X є худим і тому, безумовно, не оберненим (хоча це може бути залишено зворотним.) Нескладно довести (запитайте, чи потрібна вам допомога), що якщо X худий і лівий незворотній, то X ^ T * X є незворотним. У цьому випадку тоді буде рівно одне рішення. І якщо X не має повного рангового стовпця, то X ^ T * X не буде повним рангом, і тому у вас буде недостатньо визначена система.