Скасовані змінні в PCA або факторному аналізі


9

Я хочу зробити аналіз основних компонентів (факторний аналіз) на SPSS на основі 22 змінних. Однак деякі мої змінні дуже перекошені (косості, обчислені за SPSS, коливаються в межах 2–80!).

Тож ось мої запитання:

  1. Чи слід тримати подібні змінні чи можу перетворити змінні на аналіз основних компонентів? Якщо так, то як би я інтерпретував оцінки фактора?

  2. Який тип трансформації слід зробити? log10 або ln?

  3. Спочатку мій KMO (Kaiser – Meyer – Olkin) становить 0,413. Багато літератури рекомендує мінімум 0,5. Чи можу я все-таки зробити факторний аналіз чи мені потрібно видалити змінні, щоб підвищити показник KMO до 0,5?


5
Одне зауваження: PCA - це не те саме, що факторний аналіз. PCA - метод зменшення даних, FA - спроба знайти приховані змінні. Вони часто (але не завжди) дають подібні результати
Пітер Флом

Відповіді:


9
  1. Проблема Skewness в PCA така ж, як і в регресії: довший хвіст, якщо він дійсно довгий відносно всього діапазону розподілу, насправді поводиться як великий чужак - він сильно тягне лінію підгонки (головний компонент у вашому випадку) сильно до сама тому, що її вплив посилюється; його вплив посилюється, тому що це далеко від середнього значення. В контексті PCA, що дозволяє дуже перекошеним змінним, дуже схоже на виконання PCA без центрування даних (тобто, проведення PCA на основі косинусної матриці, а не кореляційної матриці). Саме ви вирішите, чи дозволити довгому хвосту так сильно впливати на результати (і нехай дані будуть) чи ні (і трансформувати дані). Питання не пов'язане з тим, як ви інтерпретуєте навантаження.

  2. Як тобі до вподоби.

  3. KMO - це індекс, який показує, чи є часткові кореляції досить малі для подання даних на факторний аналіз. Тому що при факторному аналізі ми, як правило, очікуємо, що чинник завантажить більше, ніж просто дві змінні. Ваш КМО недостатньо низький. Ви можете зробити це краще , якщо ви падаєте від змінного аналізу з низькими індивідуальними значеннями КМО (цих формами діагональ анти-зображеннями матриці, ви можете запитати , щоб показати цю матрицю в процедурі SPSS Factor). Чи може перетворення змінних у менш перекошені відновити KMO? Хто знає. Можливо. Зауважте, що KMO важливий здебільшого в моделі аналізу факторів, а не в моделі аналізу основних компонентів: у FA ви підходите парні кореляції, тоді як у PCA - ні.


2

+1 до @ttnphns, я просто хочу трохи розширити пункт №2. Трансформації часто використовують для стабілізації перекосу. Як вказує @ttnphns, ви б використовували їх, перш ніж запускати свої аналізи. Перетворення журналу - частина сімейства силових перетворень Box-Cox. Ви хочете розглянути більш широкий спектр можливих перетворень, ніж просто журнали (наприклад, квадратний корінь, зворотний тощо). Вибір між різними логарифмічними основами не впливає на силу перетворення. Коли люди збираються працювати математично з перетвореною змінною, іноді віддається перевагу природним журналам, оскільки в деяких випадках природний журнал може зробити більш чистою математику. Якщо вас це не хвилює, ви можете вибрати основу, яка полегшить тлумачення. Тобто, кожен приріст одиниці в новій шкалі буде представляти базу-кратне збільшення вихідної шкали (наприклад, якщо ви використовували базу журналу 2, то кожна одиниця була б удвічі більшою, база 10 означає, що кожна одиниця була б в 10 разів більша і т. д.), тож це може бути непогано вибрати базу такої, щоб ваші дані охоплювали кілька одиниць у трансформованій шкалі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.