Чому слід


13

У моделі ми могли б оцінити за допомогою звичайного рівняння:y=Xβ+ϵβ

у =Х β .

β^=(XX)1Xy,
і ми могли б отримати
y^=Xβ^.

Вектор залишків оцінюється за

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

де

Q=IX(XX)1X.

Моє запитання - як отримати висновок

tr(Q)=np.

Відповіді:


12

Висновок лише підраховує розміри векторних просторів. Однак це, як правило, не відповідає дійсності.

Найбільш основні властивості множення матриці показують, що лінійне перетворення, представлене матрицею задовольняєH=X(XX)X

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

демонструючи це як оператор проекції . Тому його доповнення

Q=1H

(як зазначено у питанні) також є оператором проекції. Слід - це його ранг (див. Нижче), звідки слід дорівнює . h Q n - hHhQnh

З самої його формули видно, що - матриця, пов'язана зі складом двох лінійних перетворень і самПерший ( ) перетворює - вектор в р -векторних р . Другий ( Х ) є перетворення з R р в R п визначається у = X р . Її ранг не може перевищувати менший з цих двох розмірів, який у налаштуваннях мінімум квадратів є завждиJ = ( X X ) -H X J n y

J=(XX)X
XJnypβ^XRpRny^=Xβ^ (але може бути менше p , коли J не є повноцінним). Отжеранг композиції Н = Х J не може перевищувати ранг X . Правильний висновок, отже, такийppJH=XJX

тоді і тільки тоді, коли J є повним рангом; і взагалі n tr ( Q ) n - p . У першому випадку модель, як кажуть, "ідентифікована" (для коефіцієнтів β ).tr(Q)=npJntr(Q)npβ

буде повноцінним, якщо і лише тоді, коли X X є зворотним.JXX


Геометрична інтерпретація

являє ортогональну проекцію з n- векторів y (представляє "відповідь" або "залежна змінна") на простір, що охоплюється стовпцями X (представляючи "незалежні змінні" або "коваріати"). Різниця Q = 1 - H показує, як розкласти будь-який n- вектор y на суму векторів y = H ( y ) + Q ( y ) , де перший можна "передбачити" віда другий перпендикулярно до нього . КолиHnyXQ=1Hny

y=H(y)+Q(y),
p X p H p Q n - p n - pXpстовпці породжують - мірний простір (тобто, не колінеарні), ранг є і рангом є , що відображає додаткових розмірів варіації у відповідь які не представлені в межах незалежних змінних. Слід дає алгебраїчну формулу для цих вимірів.XpHpQnpnp

Фон лінійної алгебри

Оператор проекції на векторному просторі (наприклад, ) є лінійним перетворенням (тобто, ендоморфізм з ) таким чином, що . Це робить його доповнення також оператором проекції, оскількиR n P : V V V P 2 = P Q = 1 - PVRnP:VVVP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

Усі проекції фіксують кожен елемент їх зображень, тому що коли ми можемо записати для деякого , звідкиv = P ( w ) w V w = P ( v ) = P 2 ( v ) = P ( P ( v ) ) = P ( w ) .vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

З будь-яким ендоморфізмом з є два підпростори: його ядро та його зображення Кожен вектор може бути записаний у формі де та . Тому ми можемо побудувати основу для для якої і . Коли V ker ( P ) = { v vPV Im ( P ) = { v v

ker(P)={vv|P(v)=0}
v V v = w + u w Im ( P ) u Ker ( P ) E F V E Ker ( P ) F Im ( P ) V P P E P F f f F f F P f ×
Im(P)={vv|wVP(w)=v}.
vV
v=w+u
wIm(P)uKer(P)EFVEKer(P)FIm(P)Vє кінцевомірною, матриця в цій основі буде, таким чином, у блочно-діагональній формі, з одним блоком (відповідним дії на ) всі нулі та інший (відповідний дія на ) дорівнює по матриці тотожності , де розмірність дорівнює . Слід - це сума значень по діагоналі і тому повинна дорівнювати . Це число є ранг з : розмірність його образу.PPEPFffFfPPf×1=fP

Слід дорівнює сліду (дорівнює , розмірність ) мінус слід . 1 n V P1P1nVP

Ці результати можна підсумувати твердженням, що слід проекції дорівнює його рангу.


Дуже дякую. Я дізнався багато розширених знань з вашої відповіді.
zhushun0008

19

@Dougal вже дав відповідь, але ось ще одна, трохи простіша.

Спочатку скористаємося тим, що . Отже, отримуємо:Тепер це одинична матриця, так . Тепер скористаємося тим, що , тобто слід є інваріантним при циклічних перестановках. Отже, маємо:Коли ми помножимо на , отримаємо матрицю тотожності , слід якої - . Отже, отримуємо:tr(AB)=tr(A)tr(B)

tr(Q)=tr(I)tr(X(XX)1X).
In×ntr(I)=ntr(AB)=tr(BA)
tr(Q)=ntr((XX)1(XX)).
(XX)1(XX)p×pp
tr(Q)=np.

6

Припустимо, що і що є повноцінним.npX

Розглянемо компактне розкладання значення однини , де - діагональне, а мають (але зауважте, що є рейтингом не більше тому він не може бути ). ПотімX=UΣVTΣRp×pURn×p,VRp×pUTU=VTV=VVT=IpUUTpIn

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

Тепер існує матриця така, що є єдиною. Ми можемо записати Ця форма показує, що є позитивним напіввизначеним, а оскільки це дійсний svd, а особливі значення є квадратом власних значень квадратної симетричної матриці, також говорить нам, що має власні значення 1 (кратності ) і 0 (множинності ).U2Rn×npUn=[UU2]QQn-ppQn-p

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
QQnppQnp.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.