Питання про нормальне підтвердження рівняння


11

Як можна довести, що нормальні рівняння: мають один чи більше розв’язків без припущення, що X є незворотним?(XTX)β=XTY

Єдина моя здогадка - це щось спільне з узагальненим зворотним, але я повністю втрачений.


1
Ви набираєте бали, задаючи питання, які провокують дивовижні відповіді.
Nikana Reklawyks

Відповіді:


14

Можна спокуситись глібом і зазначити це тому, що квадратична форма

β(YXβ)(YXβ)

є позитивним напіввизначеним, існує для якого він мінімальний, і цей мінімум знайдений (встановивши градієнт відносно β до нуля) з нормальними рівняннямиββ

XX(YXβ)=0,

звідки має бути принаймні одне рішення , незалежно від рангу XX . Однак, здається, цей аргумент не відповідає духу питання, який, як видається, є суто алгебраїчним твердженням. Можливо, цікаво зрозуміти, чому таке рівняння повинно мати рішення та за яких саме умов. Тож почнемо спочатку і зробимо вигляд, що ми не знаємо зв’язку з найменшими квадратами.


Це все зводиться до значення , транспонованою X . Це виявиться питанням простого визначення, відповідного позначення та концепції невідродженої напівлінійної форми. Нагадаємо, що X - "матриця проектування" з n рядків (по одному для кожного спостереження) та p стовпців (по одній для кожної змінної, включаючи постійну, якщо така є). Отже, це являє собою лінійне перетворення з векторного простору V = R p в W = R n .XXXnpV=RpW=Rn

Транспонування , що розглядається як лінійне перетворення , є лінійним перетворенням подвійних просторів X : WV . Для того , щоб мати сенс композиції , як X ' X , то необхідно визначити W * з W . Це те, що звичайне скалярний твір (сума квадратів) на W робить.X X:WVXXWWW

Насправді є два внутрішні добутки і g W, визначені на V і W відповідно. Це дійсні значення білінеарних симетричних функцій, які не вироджуються . Останнє означає, щоgVgWVW

gW(u,v)=0 uWv=0,

з аналогічною звітністю за . Геометрично ці внутрішні вироби дозволяють нам вимірювати довжину та кут. Умова г ( U , V ) = 0 можна розглядати як у будучи «перпендикулярно» до V . Невиродженість означає, що тільки нульовий вектор перпендикулярний до всього векторного простору. (Ця спільність означає , що отримані тут результати будуть застосовуватися до узагальненим методом найменших квадратів , що встановлюють, для яких г W не обов'язково звичайне скалярний твір дається як сума добутків компонент, але деяка довільна невироджених форма. Ми могли б обійтися без гgVg(u,v)=0uvgW взагалі, визначаючи X : WV , але я очікую, що багато читачів будуть незнайомими або незручними з подвійними пробілами, і тому вирішують уникати цієї формулювання.)gVX:WV

З цими внутрішніми продуктами в русі перенесення будь-якого лінійного перетворення визначається X ' : WV черезX:VWX:WV

gV(X(w),v)=gW(w,X(v))

для всіх і про V . Що існує насправді вектор X ( w ) V з цією властивістю, можна встановити, виписавши речі з підстав для V і W ; що цей вектор унікальний випливає з не виродженості внутрішніх продуктів. Бо якщо v 1 і v 2 - два вектори, для яких g V ( v 1 , v ) = g V ( v 2 , vwWvVX(w)VVWv1v2 для всіх v V , тоді (від лінійності в першому компоненті) g V ( v 1 - v 2 , v ) = 0 для всіх v, що означає v 1 - v 2 = 0 .gV(v1,v)=gV(v2,v)vVgV(v1v2,v)=0vv1v2=0

Коли запис U для безлічі всіх векторів , перпендикулярних до кожного вектору в U . Крім того, напишіть X ( V ) для зображення X , визначеного як множина { X ( v ) | v V } W . Фундаментальне співвідношення між X та його транспонтом X ' єUW,UUX(V)X{X(v)|vV}WXX

X(w)=0wX(V).

Тобто, знаходиться в ядрі X ' тоді і тільки тоді , коли ш перпендикулярно до образу X . wXwX Це твердження говорить про дві речі:

  1. Якщо , то g W ( w , X ( v ) ) = g V ( X ( w ) , v ) = g V ( 0 , v ) = 0 для всіх v V , що просто означає, що w перпендикулярно до X ( V ) .X(w)=0gW(w,X(v))=gV(X(w),v)=gV(0,v)=0vVwX(V)

  2. Якщо перпендикулярно X ( V ) , це означає лише g W ( w , X ( v ) ) = 0 для всіх v V , але це еквівалентно g V ( X ( w ) , v ) = 0 і не виродженість g V означає X ( w ) = 0 .wX(V)gW(w,X(v))=0vVgV(X(w),v)=0gVX(w)=0

Ми фактично закінчили зараз. Аналіз показав, що розкладається як прямий добуток W = X ( V ) X ( V ) . Тобто, ми можемо взяти будь-який довільний y W і записати його однозначно як y = y 0 + y з y 0X ( V ) і y X ( V ) . Це означає, що y 0WW=X(V)X(V) yWy=y0+yy0X(V)yX(V)y0має вигляд принаймні один & beta ; V . Зверніть увагу, щоX(β)βV

yXβ=(y0+y)y0=yX(V)

Фундаментальне співвідношення говорить, що те саме, що ліва сторона знаходиться в ядрі :X

X(yXβ)=0,

βXXβ=Xy.


nyWy0Xyy0y0pβVX(V)XXVW

VU=X(V)WXU


Один цікавий результат цієї абстрактної алгебраїчної демонстрації - це те, що ми можемо розв’язати нормальні рівняння у довільних векторних просторах. Результат справедливий, скажімо, для складних просторів, для просторів над кінцевими полями (де мінімізація суми квадратів має мало сенсу), і навіть над нескінченномірними просторами, які підтримують відповідні послідовні форми.


1
У мене ніколи не було представника, щоб прийняти цю відповідь набагато пізніше. Я просто натрапив на це і хотів ще раз подякувати вам!
ryati

β(YXβ)(YXβ)
β(YXβ)(YXβ),
f:AB.
Майкл Харді

@Michael У вашому коментарі має бути помилка друку. Чи проти зауважити, що ви мали на увазі?
whuber

''''
Майкл Харді

@Michael Пробач, що не бачив цієї відзнаки, незважаючи на багато прочитаних. Незалежно від мене перша стрілка стосується ін'єкційної функції, тоді як друга стосується будь-якої функції, але я підозрюю, що це не те, що ви маєте намір. Ви не проти пояснити свою нотацію?
whuber

0

nXTXxxi=xyy¯


X=[1 x1;1 x2;;1 xn]X=[1 x11xm1;;1 x1nxmn]

3
XX

0

У типовій регресії X є худим і тому, безумовно, не оберненим (хоча це може бути залишено зворотним.) Нескладно довести (запитайте, чи потрібна вам допомога), що якщо X худий і лівий незворотній, то X ^ T * X є незворотним. У цьому випадку тоді буде рівно одне рішення. І якщо X не має повного рангового стовпця, то X ^ T * X не буде повним рангом, і тому у вас буде недостатньо визначена система.


1
XXX0β=0 β

whuber: звичайно, вони вирішують питання: один soln, якщо X повна стовпчаста колонка (як я вже згадував), і нескінченні рішення, якщо це
недостатньо визначена

1
Той факт, що система "недостатньо визначена", не означає, що вона взагалі не має ніяких рішень. Питання полягає у існуванні рішень.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.