Інтерпретація балів PCA


16

Чи може хто-небудь допомогти мені в інтерпретації результатів PCA? Мої дані походять з анкети щодо ставлення до ведмедів. Згідно з навантаженнями, я тлумачив один із своїх основних компонентів як "страх перед ведмедями". Чи будуть пов’язані оцінки цього основного компонента з тим, як кожен респондент вимірює рівень до цього основного компонента (чи оцінює він позитивно / негативно на ньому)?


Коротка відповідь на ваше запитання ТАК.
Амеба каже: Відновити Моніку

Відповіді:


13

В основному, показники коефіцієнтів обчислюються як вихідні відповіді, зважені факторними навантаженнями. Отже, вам потрібно переглянути факторні навантаження вашого першого виміру, щоб побачити, як кожна змінна стосується головного компонента. Спостереження за високими позитивними (відповідно негативними) навантаженнями, пов’язаними з конкретними змінними, означає, що ці змінні позитивно (відповідно до негативно) сприяють цьому компоненту; отже, люди, які набрали високу оцінку за цими змінними, як правило, мають більш високі (відповідно нижчі) коефіцієнти для цього конкретного виміру.

Малювання кола кореляції корисно мати загальне уявлення про змінні, які сприяють "позитивно" проти "негативно" (якщо такі є) до першої головної осі, але якщо ви використовуєте R, ви можете ознайомитися з пакетом FactoMineR і dimdesc()функція.

Ось приклад із USArrestsданими:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

Як видно з останнього результату, перший вимір в основному відображає насильницькі дії (будь-якого виду). Якщо ми подивимось на окрему карту, то зрозуміло, що держави, розташовані праворуч, - це ті, де такі дії найчастіші.

alt текст alt текст

Можливо, вас також зацікавить це пов'язане питання: Що таке головні складові показники?


5

Для мене результати PCA - це лише перестановка даних у формі, яка дозволяє мені пояснити набір даних із меншими змінними. Оцінки представляють, наскільки кожен елемент відноситься до компонента. Ви можете назвати їх за факторним аналізом, але важливо пам’ятати, що вони не є прихованими змінними, оскільки PCA аналізує всі дисперсії в наборі даних, а не лише спільні елементи (як це робить факторний аналіз).


Так, ви праві, говорячи, що жодна модель помилок не включена в PCA, на відміну від FA. Я поставив +1 за цей конкретний момент. Зауважте, що я сказав "має сенс врахувати", а не те, що основні компоненти, витягнуті з PCA, є справжніми НН. Якщо ви не зацікавлені в оцінці надійності шкали або моделей вимірювання, це мало має значення, чи використовуєте ви PCA або FA. Зараз аналіз даних часто стосується пояснення кореляції між змінними або пошуку груп предметів, звідси ідея інтерпретації одного або декількох вимірів факторного простору. (...)
chl

(...) FactoMineR містить набір даних про вина, і для гри з ним можна використовувати багато факторних методів (PCA, MFA), і навіть PLS або CCA, як це було зроблено Мішелем Тененхаузом.
chl

@ chl, Дякую за підказку щодо пакунку, я перевірю це. На PCA проти FA я згоден до певного моменту. Я вважаю за краще ФА для більшості заявок, оскільки я фінансую оцінки комунальних (загальна дисперсія) як дуже корисні при оцінці вартості певної структури факторів. Однак це може бути лише особистим уподобанням.
richiemorrisroe

Ви абсолютно праві (я вже підтримав вашу попередню відповідь, оскільки це було зрозуміло). Просто у PCA є своя історія аналізу даних (особливо французької школи) разом із CA, MFA, MCA. З іншого боку, Пол Клайн має дві дуже приємні книги про використання ФА в дослідженнях особистості. І майбутня книга Вільяма Ревелла повинна стати роком для користувачів R :) Ну, у будь-якому випадку, я думаю, ми погоджуємось, що це корисні інструменти для аналізу структури кореляційної матриці.
chl

0

Результати PCA (різні розміри або компоненти), як правило, не можуть бути перетворені на реальну концепцію. Я думаю, що неправильно вважати, що одним із компонентів є "страх перед ведмедями". Процедура основних компонентів перетворює вашу матрицю даних у нову матрицю даних з однаковою або меншою кількістю розмірів, а отримані розміри коливаються від тієї, що краще пояснює дисперсію до тієї, яка пояснює її меншою. Цей компонент обчислюється на основі поєднання вихідних змінних із обчисленими власними векторами. Загальна процедура PCA перетворює вихідні змінні в ортогональні (лінійно незалежні). Сподіваюся, це допоможе вам трохи уточнити процедуру pca


Чи погоджуєтесь ви, що лінійна комбінація деяких змінних все ще може бути інтерпретована як відображення певного зваженого внеску кожної з них у вісь фактора?
chl

Так, саме так.
mariana soffer

Отже, чому заважати давати йому ім’я? Змінні просто розглядаються як явні змінні, і в деяких випадках має сенс вважати їх зважену комбінацію як відображаючу латентний (незабезпечений) коефіцієнт.
chl
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.