Що таке основні компоненти, що обертаються та не враховуються, враховуючи, що PCA завжди обертає осі координат?


13

Наскільки я розумію, основні компоненти отримуються обертанням координатних осей для вирівнювання їх до напрямків максимальної дисперсії.

Тим не менш, я продовжую читати про "невратовані основні компоненти", і моє програмне забезпечення для статистики (SAS) дає мені основні компоненти, що повертаються з варімаксом, а також невратовані. Тут я плутаюся: коли ми обчислюємо основні компоненти, осі вже обертаються; так чому ж потрібна інша ротація? А що означає "непроголошений головний компонент"?


1
Питання виключно про те, як працює програмне забезпечення, тут поза темою, але у вас може бути поховане справжнє статистичне питання. Ви можете відредагувати своє запитання, щоб уточнити основну статистичну проблему. Ви можете виявити, що, розуміючи пов'язані із статистичними поняттями, специфічні для програмного забезпечення елементи само собою зрозумілі або принаймні легко дістатись із документації.
gung - Відновіть Моніку

1
@gung - моє запитання не стосується програмного забезпечення. Можливо, я поставив це неправильно. Все, що я хотів знати, - це те, що, наскільки я розумію, ми отримуємо основні компоненти лише тоді, коли обертаємо осі в лінії максимальної дисперсії. Тоді, що таке непомічений головний компонент, термін, який я знайшов на різних сторінках, що пояснюють про PCA. Будь ласка, повідомте мені, якщо моє питання все ще неоднозначне.
Srewashi Lahiri

Звичайно, схоже, що мова йде про SAS. Якщо це не так, я б відредагував ваш Q, щоб видалити посилання на SAS і повторно пояснив ваше запитання з точки зору програмного забезпечення. Вам також може бути цікаво прочитати цю тему .
gung - Відновіть Моніку

Я згадав про SAS, тому що я проводив аналіз у цьому програмному забезпеченні. Навіть якщо ви знижете слово, ви можете просто надати мені пояснення до моєї редагованої версії питання. Також я пройшов через нитку. Будь ласка, виправте мене, якщо я помиляюся. Коли ми обчислюємо основні компоненти, це означає, що осі вже обертаються. Отже, інше позначення varimax не потрібно. Невже це так? Я дуже розгублений у цій частині. Заздалегідь
дякую

2
Srewashi, я взяв на себе сміття істотно переписати ваше запитання, виходячи з ваших уточнень у коментарях. Я думаю, що це гарне питання, +1. Перевірте, чи мої правки відображають ваші наміри! Ви завжди можете редагувати більше. Cc до @gung.
Амеба каже, що повернемо Моніку

Відповіді:


15

Це буде нетехнічною відповіддю.

Ви маєте рацію: PCA - це по суті обертання координатних осей, вибране таким чином, що кожна успішна вісь фіксує якомога більше варіацій.

У деяких дисциплінах (наприклад, наприклад, психологія) люди люблять застосовувати PCA для інтерпретації отриманих осей. Тобто вони хочуть сказати, що головна вісь №1 (яка є певною лінійною комбінацією оригінальних змінних) має певне значення. Щоб здогадатися про це значення, вони б дивились на ваги в лінійній комбінації. Однак ці ваги часто брудні, і чіткого сенсу не вдається зрозуміти.

У цих випадках люди іноді вирішують трохи попоїсти розчином ванільного PCA. Вони беруть певну кількість основних осей (які за деяким критерієм вважаються "значущими") та додатково обертають їх, намагаючись досягти певної "простої структури" --- тобто лінійних комбінацій, які було б простіше інтерпретувати. Існують конкретні алгоритми, які шукають найпростішу можливу структуру; одна з них називається варімакс. Після обертання varimax послідовні компоненти вже не захоплюють стільки можливих варіацій! Ця особливість PCA порушується шляхом додаткового обертання varimax (або будь-якого іншого).

Отже, перед тим, як застосувати обертання varimax, ви маєте "невстановлені" основні компоненти. А згодом ви отримуєте «обертові» основні компоненти. Іншими словами, ця термінологія стосується післяобробки результатів PCA, а не самого обертання PCA.


Все це дещо ускладнюється тим, що обертаються - це навантаження, а не основні осі як такі. Однак, щодо математичних деталей я посилаюся на вас (і будь-якого зацікавленого читача) на свою довгу відповідь тут: Чи PCA супроводжується обертанням (наприклад, varimax), як і раніше PCA?


Я ще не натрапив на краще та чіткіше пояснення. Я також пройшов інше посилання, яке ви надали, але я ще розшифровую його в цілому. Якщо я правильно зрозумів, невказані головні компоненти вже є ортогональними та некорельованими. Тут у мене невелика плутанина - оскільки ПК відповідають послідовній максимальній дисперсії, то чи потрібно після того, як буде знайдено перший ПК, друга максимальна лінія дисперсії (друга ПК) буде знаходитись на 90 градусах (ортогональна) до першої та ін. ?
Srewashi Lahiri

Правильно: основні компоненти "непроголошені" є неспорідненими, а "неротовані" головні осі - ортогональними. І так, необхідно, щоб послідовні головні осі були ортогональними, а основні компоненти не співвідносяться з попередніми (це можна довести математично). До речі, якщо ви вважаєте, що ця (або будь-яка інша) відповідь вирішує питання для вас, ви можете "прийняти" її, натиснувши на зелену галочку зліва. Як тільки ви досягнете 15 репутації, ви також зможете отримати відповіді, які вам здадуться корисними (я думаю, що наразі ви не зможете отримати жодних відповідей).
амеба каже, що повернеться до Моніки

+1. what gets rotated are loadings and not principal axes as suchДодам, що це технічне поняття. Теоретично ці два типи обертання є протиставними. У PCA ми обертаємось, щоб знайти конкретну ортогональну основу (ту, яка має найкрутіший графік обліку власних значень). У varimax ми обертаємося, щоб знайти іншу специфічну ортогональну основу (із інтерпретаційною самою структурою). Ми могли б робити будь-яку ортогональну основу.
ttnphns

Якщо можливо, ви можете пояснити це простою людиною, що означає невстановлений ПК?
sai_636

@ sai_636 Щодо термінів для непрофесійних людей, див. stats.stackexchange.com/questions/2691 .
Амеба каже:
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.