Чи PCA ядра з лінійним ядром еквівалентний стандартному PCA?


17

Якщо в PCA ядра я вибираю лінійне ядро , результат буде відрізнятися від звичайного лінійного PCA ? Чи принципово різні рішення чи існує певне чітко визначене співвідношення?K(x,y)=xy

Відповіді:


27

Підсумок: PCA ядра з лінійним ядром точно еквівалентно стандартному PCA.

Нехай - центрована матриця даних розміром з змінними у стовпцях та точками даних у рядках. Тоді коваріаційна матриця задається , її власні вектори є головними осями, а власні значення - відмінністю ПК. У той же час, можна розглядати так звану матрицю Грама частину розмір. Неважко помітити, що він має однакові власні значення (тобто дисперсії ПК) аж до коефіцієнта , а його власні вектори - це основні компоненти, масштабовані до одиничної норми. N × D D N D × D XX / ( n - 1 ) X X N × N n - 1XN×DDND×DXX/(n1)XXN×Nn1

Це був стандартний PCA. Тепер у PCA ядра ми розглядаємо деяку функцію яка відображає кожну точку даних на інший векторний простір, який зазвичай має більшу розмірність , можливо навіть нескінченний. Ідея ядра PCA полягає у виконанні стандартного PCA в цьому новому просторі.D n e wϕ(x)Dnew

Оскільки розмірність цього нового простору дуже велика (або нескінченна), важко або неможливо обчислити матрицю коваріації. Однак ми можемо застосувати другий підхід до PCA, окреслений вище. Дійсно, матриця Грама все одно буде однаково керована розміром. Елементи цієї матриці задаються , яку ми будемо називати функцією ядра . Це те, що відоме як трюк ядра : насправді ніколи не потрібно обчислювати , а лише . Власні вектори цієї матриці Грама будуть основними компонентами в цільовому просторі, тим, що нас цікавить.N×Nϕ(xi)ϕ(xj)K(xi,xj)=ϕ(xi)ϕ(xj)ϕ()K()

Тепер відповідь на ваше запитання стає очевидною. Якщо , то матриця Грама ядра зводиться до що дорівнює стандартній матриці Грама і, отже, основні компоненти не зміняться.K(x,y)=xyXX

Дуже читається посилання на Scholkopf B, Smola A та Müller KR, аналіз основних компонентів Kernel, 1999 р. , І зауважте, що, наприклад, на малюнку 1 вони прямо посилаються на стандартний PCA як той, що використовує крапковий продукт як функцію ядра:

ядро PCA


це були ті знімки у вашій відповіді? З якоїсь книги?
Буратіно

@ Піноккіо, фігура взята у Scholkopf et al. папір, на який посилається і пов'язаний у моїй відповіді.
Амеба каже: Відновити Моніку

"Неважко помітити, що він має однакові власні значення (тобто дисперсії ПК) аж до фактора n-1 " - чи не означає це, що тоді вони не є повністю еквівалентними? Скажімо, у мене є матриця з n = 10 зразків, d = 200 розмірів. У стандартному PCA я міг би спроектувати дані на 199 розмірів, якби хотів, але в PCA ядра з лінійним ядром я можу мати до 10 вимірів.
Сезар

1
@ Cesar, ні, якщо у вас n = 10 зразків, матриця коваріації матиме ранг 10-1 = 9, а стандартний PCA знайде лише 9 розмірів (як і PCA ядра). Дивіться тут: stats.stackexchange.com/questions/123318 .
амеба каже, що повернеться до Моніки

Я отримую файл, не знайдений для посилання на Scholkopf B, Smola A та Müller KR.
pbible

5

Окрім приємної відповіді амеби, існує ще простіший спосіб побачити еквівалентність. Знову нехай - матриця даних розміром N × D з D змінними в стовпцях і N точками даних у рядках. Стандартний РСА відповідає приймає розкладання по сингулярним значенням матриці X = U Σ V з U основні компоненти X . Синулярне розкладання величини лінійного ядра X X = U Σ 2 U XN×DDNX=UΣVUXXX=UΣ2U має однакові ліві сингулярні вектори і тому однакові головні компоненти.


Щодо стандартного PCA, я думав, що ми піклуємось про SVD коваріаційної матриці, тож насправді не розумію, наскільки SVD X має значення, чи можете ви, будь ласка, розширити?
m0s

@ m0s Для PCA ми дбаємо про ейгендекомпозицію матриці коваріації, яку ми зазвичай виконуємо за SVD (в центрі) матриці даних.
MrDrFenner

1

Мені здається, що KPCA з лінійним ядром має бути таким же, як і простий PCA.

Матриця коваріації, з якої ви збираєтеся отримувати власні значення, однакова:

linearKPCAmatrix=1lj=1lK(xj,xj)=1lj=1lxjxjT=PCAmatrix

З більш детальною інформацією можна ознайомитись тут .


3
K(xi,xj)
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.