Чи унікальні рішення PCA?


12

Коли я запускаю PCA на певному наборі даних, чи рішення мені надається унікальним?

Тобто, я отримую набір 2d координат на основі проміжних відстаней. Чи можливо знайти хоча б ще одне розташування точок, яке б відповідало цим обмеженням?

Якщо відповідь "так", як я можу знайти таке різне рішення?


11
Відповідь на питання про унікальність - і так, і ні. Це "так" в тому сенсі, що власні простори та власні значення математично добре і однозначно визначені. Почуттям «ні» є те, що (а) існує кілька способів представити ці власні простори (навіть нормалізований власний вектор можна заперечувати, і існує багато варіантів основи для вироджених власних просторів) і (б) різні алгоритми можуть давати результати, які відрізняються через накопичення помилки з плаваючою комою в розрахунках.
whuber

Рамсей і Сільверман у книзі "Функціональний аналіз даних" згадують обертання VARIMAX. Ви говорите про розбиття набору даних функцій (представлених як матриця) на основні компоненти.
потужність

Здається, ви хочете використовувати PCA як інструмент для зменшення розмірів. Ви можете почати з огляду зменшення розмірності ...
Елвіс

Відповіді:


7

Ні, відповідь не є однозначною. Є багато способів цього показати. Однією з можливостей є зауваження, що спектральне розкладання квадрата по матриці є рішенням максимізації опуклої функції . Розглянемо перший власний вектор / значення:p X wppXw

λ1=maxwRp:||w||=1wXw

(де - перше власне значення, а перший власний вектор).λ1w

Рішення таких проблем (наприклад , значення досягнення цієї максимум), загалом, не є унікальним.w

Однак алгоритми обчислення цих рішень є детермінованими, це означає, що, крім економії для числових кутових випадків, отримані рішення повинні бути однаковими.

Приклад таких числових кутових випадків: випадки, коли кілька власних значень (чисельно) однакові, випадки, коли має дефіцит за рангом ...X


7

Що ще не помічено, це те, що просто повернення знака ПК створює інше рішення. Тобто, якщо є ятим головним компонентом, то також є рішенням го головного компонента. Це викликало плутанину раніше, особливо коли ваш комп'ютер видає змінні ПК. Дивіться це питання .wnwn


3
Про цікаве практичне застосування цієї неоднозначності дивіться на сайті stats.stackexchange.com/questions/34396 . (До речі, зміна знака була зауважив: см перший коментар до цього питання.)
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.