Мета функції PCA: який зв'язок між максимальною дисперсією та мінімізацією помилок?


32

Алгоритм PCA можна сформулювати за допомогою кореляційної матриці (припустимо, що дані вже нормалізовані, і ми розглядаємо лише проекцію на перший ПК). Цільову функцію можна записати так:X

maxw(Xw)T(Xw)s.t.wTw=1.

Це добре, і для його вирішення використовуємо множники Лагрангія, тобто переписуємо їх як:

maxw[(Xw)T(Xw)λwTw],

що еквівалентно

maxw(Xw)T(Xw)wTw,

і, отже, ( див. тут на Mathworld ), схоже, дорівнює

maxwi=1n(distance from point xi to line w)2.

Але це говорить про те, щоб збільшити відстань між точкою та прямою, і з того, що я тут прочитав , це неправильно - це має бути min , а не max . Де моя помилка?

Або може мені хтось показати зв’язок між максимізацією дисперсії в прогнозованому просторі та мінімізацією відстані між точкою та лінією?


Я думаю, що мінімальна відстань використовується для задоволення критерію ортогональності компонентів. Точки проектуються в ПК, які є ортогональними один одному, але в кожному послідовному компоненті решта дисперсії максимальна.
Майкл Р. Черник

Підказка: Що трапляється, якщо спочатку розглядати найменше власне значення, а не найбільше?
блукання

@whuber Найменший власне значення, мабуть, має ПК, який є вирішенням кінцевої цільової функції. Але цей ПК не забезпечує максимальної оригінальної цільової функції.
Cam.Davidson.Pilon

2
Я не впевнений, що ви маєте на увазі під "кінцевою" та "оригінальною" цільовою функцією, Кам. PCA не є (концептуально) програмою оптимізації. Його вихід - це сукупність основних напрямків, а не лише один. Математична теорема (цікава) полягає в тому, що ці напрямки можна знайти, вирішивши послідовність обмежених квадратичних програм, але це не є основним для понять чи практики PCA. Я лише припускаю, що, орієнтуючись на найменше власне значення, а не на найбільше, ви можете узгодити дві ідеї (1) мінімізації відстаней та (2) з точки зору оптимізації PCA.
whuber

1
Це гаразд - ваша відповідь була невірною версією того, що я намагався зробити.
Cam.Davidson.Pilon

Відповіді:


42

Нехай є центрованою матрицею даних з спостереженнями у рядках. Нехай є його коваріаційною матрицею. Нехай - одиничний вектор, що вказує вісь у змінному просторі. Ми хочемо бути першою основною віссю.XnΣ=XX/(n1)ww

Згідно з першим підходом, перша головна вісь максимізує дисперсію проекції (дисперсія першого головного компонента). Цю дисперсіюXw

Var(Xw)=wXXw/(n1)=wΣw.

Згідно з другим підходом, перша головна вісь мінімізує похибку відновлення між та її реконструкцією , тобто суму квадратних відстаней між вихідними точками та їх проекціями на . Квадрат помилки відновлення задається XXwww

XXww2=tr((XXww)(XXww))=tr((XXww)(XwwX))=tr(XX)2tr(XwwX)+tr(XwwwwX)=consttr(XwwX)=consttr(wXXw)=constconstwΣw.

Помітьте знак мінус перед основним терміном. Через це мінімізація помилки відновлення означає максимізацію , що є дисперсією. Отже мінімізація похибки відновлення еквівалентна максимальній дисперсії; обидві рецептури дають однаковий .wΣww


Щось я помітив, чи не опукла функція (Що стосується як - PSD? Як ми намагаємося її максимально використовувати?wTΣwwΣ
Royi

@amoeba, чи можете ви пояснити, як перейти від tr () до const на останньому кроці?
Альберто

1
@alberto Що знаходиться у сліді - це число (1x1 матриця); слід від числа - це саме число, тому слід можна видалити. Константа з'являється тому, що дорівнює , тому є цей коефіцієнт . ΣXX/n1/n
амеба каже, що повернеться до Моніки

1
@Leullame Обчислення буде дослідним для якщо це матриця з ортонормальними стовпцями. Вам потрібно щоб перейти від рядка №3 до рядка №4. Якщо матриця має ортонормальні стовпці, то дійсно буде проекцією на підпростір, що охоплюється стовпцями (тут - вектор рядка). WWW=IWxWWxWx
амеба каже: Відновіть Моніку

1
@ DanielLópez Ну, ми шукаємо 1-мірний підпростір, мінімізуючи помилку відновлення. 1-мірний підпростір може бути визначений вектором одиничної норми, що вказує на його напрямок, яким саме вважається . Він має одиничну норму за конструкцією. w
Амеба каже: Відновити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.