Якщо в PCA ядра я вибираю лінійне ядро , результат буде відрізнятися від звичайного лінійного PCA ? Чи принципово різні рішення чи існує певне чітко визначене співвідношення?
Якщо в PCA ядра я вибираю лінійне ядро , результат буде відрізнятися від звичайного лінійного PCA ? Чи принципово різні рішення чи існує певне чітко визначене співвідношення?
Відповіді:
Підсумок: PCA ядра з лінійним ядром точно еквівалентно стандартному PCA.
Нехай - центрована матриця даних розміром з змінними у стовпцях та точками даних у рядках. Тоді коваріаційна матриця задається , її власні вектори є головними осями, а власні значення - відмінністю ПК. У той же час, можна розглядати так звану матрицю Грама частину розмір. Неважко помітити, що він має однакові власні значення (тобто дисперсії ПК) аж до коефіцієнта , а його власні вектори - це основні компоненти, масштабовані до одиничної норми. N × D D N D × D X ⊤ X / ( n - 1 ) X X ⊤ N × N n - 1
Це був стандартний PCA. Тепер у PCA ядра ми розглядаємо деяку функцію яка відображає кожну точку даних на інший векторний простір, який зазвичай має більшу розмірність , можливо навіть нескінченний. Ідея ядра PCA полягає у виконанні стандартного PCA в цьому новому просторі.D n e w
Оскільки розмірність цього нового простору дуже велика (або нескінченна), важко або неможливо обчислити матрицю коваріації. Однак ми можемо застосувати другий підхід до PCA, окреслений вище. Дійсно, матриця Грама все одно буде однаково керована розміром. Елементи цієї матриці задаються , яку ми будемо називати функцією ядра . Це те, що відоме як трюк ядра : насправді ніколи не потрібно обчислювати , а лише . Власні вектори цієї матриці Грама будуть основними компонентами в цільовому просторі, тим, що нас цікавить.
Тепер відповідь на ваше запитання стає очевидною. Якщо , то матриця Грама ядра зводиться до що дорівнює стандартній матриці Грама і, отже, основні компоненти не зміняться.
Дуже читається посилання на Scholkopf B, Smola A та Müller KR, аналіз основних компонентів Kernel, 1999 р. , І зауважте, що, наприклад, на малюнку 1 вони прямо посилаються на стандартний PCA як той, що використовує крапковий продукт як функцію ядра:
Окрім приємної відповіді амеби, існує ще простіший спосіб побачити еквівалентність. Знову нехай - матриця даних розміром N × D з D змінними в стовпцях і N точками даних у рядках. Стандартний РСА відповідає приймає розкладання по сингулярним значенням матриці X = U Σ V ⊤ з U основні компоненти X . Синулярне розкладання величини лінійного ядра X X ⊤ = U Σ 2 U ⊤ має однакові ліві сингулярні вектори і тому однакові головні компоненти.