Що саме називається "головним компонентом" в PCA?


18

Припустимо є вектор , який максимізує дисперсію проекції даних з конструкцією матриці .XuX

Тепер я бачив матеріали, які називають (першим) основним компонентом даних, який також є власним вектором з найбільшим власним значенням.u

Однак я також бачив, що основною складовою даних є .Xu

Очевидно, і і різні речі. Хто-небудь може мені тут допомогти і сказати, в чому різниця між цими двома визначеннями основних компонентів?X uuXu


Власний вектор u - напрямок осі (значення u - напрямок косинусів відносно вихідних осей). Сю - самі дані, значення головного компонента, координати на вищезгадану вісь).
ttnphns

Відповіді:


25

Ви абсолютно правильні, спостерігаючи, що навіть незважаючи на те, що (один із власних векторів коваріаційної матриці, наприклад, перший) та (проекція даних на 1-мірний підпростір, охоплений ) - це дві різні речі, обидва їх часто називають "головним компонентом", іноді навіть в одному тексті.X u uuXuu

У більшості випадків із контексту видно, що саме мається на увазі. Однак у деяких рідкісних випадках це може бути дуже заплутаним, наприклад, коли обговорюються деякі споріднені методи (наприклад, рідкісний PCA або CCA), де різні напрямки не повинні бути ортогональними. У цьому випадку твердження типу "компоненти є ортогональними" має дуже різні значення залежно від того, стосується він осей чи проекцій.ui

Я б закликав називати "головною віссю" або "головним напрямком", а "головним компонентом".X uuXu

Я також бачив називається "основний вектор компонента".u

Я мушу зазначити, що альтернативним умовою є називати "головним компонентом", а "результатами головного компонента".X uuXu

Короткий зміст двох конвенцій:

Convention 1Convention 2u{principal axisprincipal directionprincipal component vectorprincipal componentXuprincipal componentprincipal component scores

Примітка: Тільки власні вектори матриці коваріації, що відповідають ненульовим власним значенням, можна назвати основними напрямками / компонентами. Якщо матриця коваріації низького рангу, вона матиме одне або більше нульових власних значень; відповідні власні вектори (і відповідні проекції, постійні нулю) не повинні називатися основними напрямками / компонентами. Дивіться певну дискусію в моїй відповіді тут.


1
Конвенція 2 повинна бути поза законом. Він має здатність створювати непорозуміння для початківців, оскільки він поєднує базові вектори та компоненти векторів даних відносно основи.
вигадки

як щодо визначення навантажень? Чи є навантаження індивідуальними значеннями власного вектора u?
makis


@amoeba дякую! останнє запитання. У SVD для X = USVh (Vh: V переміщено), якщо власними векторами є стовпці U, то чи можу я назвати Vh як навантаження?
makis

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.