Про використання косого обертання після PCA


9

Кілька статистичних пакетів, такі як SAS, SPSS і R, дозволяють здійснити якесь обертання факторів після PCA.

  1. Чому після PCA необхідний обертання?
  2. Чому б ви застосували похиле обертання після PCA, враховуючи, що метою PCA є створення ортогональних розмірів?

Я задав питання, що ілюструє необхідність обертання факторів після PCA, оскільки PCA дає упереджений результат. Дивіться stats.stackexchange.com/questions/6575/…
mbaitoff

Відповіді:


8

Я думаю, що щодо PCA існують різні думки чи погляди, але в основному ми часто думаємо про це як про техніку скорочення (ви зменшуєте простір своїх функцій до меншого, часто набагато більш "читабельного", надаючи вам подбати про правильне центрування / стандартизацію дані, коли це потрібно) або спосіб побудови прихованих факторівабо розміри, на які припадає значна частина міжособистісної дисперсії (тут "індивіди" означають статистичні одиниці, за якими збираються дані; це може бути країна, люди тощо). В обох випадках ми побудуємо лінійні комбінації вихідних змінних, які враховують максимум дисперсії (якщо проектується на головну вісь), за умови обмеження ортогональності між будь-якими двома основними компонентами. Тепер те, що було описано, є чисто алгебричним чи математичним, і ми не вважаємо це як (генеруючу) модель, всупереч тому, що робиться в традиції аналізу факторів, де ми включаємо термін помилки для обліку якоїсь помилки вимірювання . Мені також подобається вступ Вільяма Ревелла в його майбутньому посібнику з прикладної психометрії за допомогою R (Глава 6), якщо ми хочемо проаналізувати структуру кореляційної матриці, то

Перший [підхід, PCA] - це модель, яка наближає кореляційну матрицю з точки зору добутку компонентів, де кожен компонент є зваженою лінійною сумою змінних, друга модель [факторний аналіз] також є наближенням кореляційної матриці за продукт двох факторів, але фактори в цьому розглядаються як причини, а не як наслідки змінних.

Іншими словами, за допомогою PCA ви виражаєте кожен компонент (фактор) як лінійну комбінацію змінних, тоді як у FA це змінні, що виражаються як лінійна комбінація факторів. Загальновизнано, що обидва способи дають загально подібні результати (див., Наприклад, Harman, 1976 або Catell, 1978), особливо в "ідеальному" випадку, коли ми маємо велику кількість людей і хороший коефіцієнт співвідношення: змінні (як правило, різні від 2 до 10, залежно від авторів, яких ви вважаєте!). Це відбувається тому, що, оцінюючи діагоналі в кореляційній матриці (як це робиться в FA, і ці елементи відомі як спільності), дисперсія помилок усувається з матриці факторів. Це причина, чому PCA часто використовується як спосіб розкриття прихованих факторів або психологічних конструкцій замість FA, розроблених ще в минулому столітті. Але, йдучи цим шляхом, ми часто хочемо досягти більш легкої інтерпретації отриманої факторної структури (або так званої матриці візерунка). І тоді приходить корисна хитрість обертання факторної осі, щоб ми максимізували завантаження змінних на конкретний коефіцієнт або рівнозначно доходили до "простої структури". Використовуючи ортогональне обертання (наприклад, VARIMAX), ми зберігаємо незалежність факторів. За допомогою косого обертання (наприклад, OBLIMIN, PROMAX) ми порушуємо його, і коефіцієнти дозволяють співвідносити. Про це значною мірою обговорювалося в літературі, і це призвело до деяких авторів (не психометріків, а статистиків на початку 1960-х "

Але справа в тому, що методи обертання спочатку були розроблені в контексті підходу ФА і зараз рутинно використовуються з PCA. Я не думаю, що це суперечить алгоритмічному обчисленню основних компонентів: Ви можете повертати ваші факторні осі так, як вам потрібно, за умови, що колись співвіднесена (шляхом косого обертання) інтерпретація факторного простору стає менш очевидною.

PCA використовується звичайно при розробці нових анкетування, хоча FA є, мабуть, кращим підходом у цьому випадку, оскільки ми намагаємося витягнути значущі фактори, що враховують помилки вимірювань і чиї взаємозв'язки можна вивчити самостійно (наприклад, шляхом фактуризації отриманої структури матриці, отримуємо факторну модель другого порядку). Але PCA також використовується для перевірки факторної структури вже затверджених. Дослідники насправді не мають значення щодо FA проти PCA, коли вони мають, скажімо, 500 репрезентативних суб'єктів, яких просять оцінити 60-ти опитувальник, який вирішує п’ять заперечень (це стосується NEO-FFIнаприклад), і я думаю, що вони мають рацію, оскільки в цьому випадку ми не дуже зацікавлені у визначенні генеруючої або концептуальної моделі (термін "представник" використовується тут, щоб полегшити проблему інваріантності вимірювань ).

Тепер, щодо вибору методу обертання та чому деякі автори заперечують проти суворого використання ортогонального обертання, я хотів би навести цитату Пола Клайна, як це робив у відповідь на наступне запитання: ФА: Вибір матриці обертання, заснованої на «Простій структурі» Критерії » ,

(...) у реальному світі нерозумно думати, що фактори, як важливі визначальні фактори поведінки, співвідносяться. - П. Клайн, розвідка. Психометричний погляд , 1991, с. 19

Я б, таким чином, зробив висновок, що залежно від мети вашого дослідження (чи хочете ви виділити основні зразки вашої кореляційної матриці чи ви прагнете надати розумну інтерпретацію основних механізмів, які можуть викликати спостереження за такою кореляційною матрицею ), ви вирішите вибрати найбільш підходящий метод: це не пов'язане з побудовою лінійних комбінацій, а лише з тим, як ви хочете інтерпретувати отриманий факторіальний простір.

Список літератури

  1. Harman, HH (1976). Сучасний факторний аналіз . Чикаго, Університет Чикаго Прес.
  2. Cattell, RB (1978). Наукове використання факторного аналізу . Нью-Йорк, Пленум.
  3. Клайн, П. (1991). Розвідка. Психометричний погляд . Routledge.

4

Проблема з ортогональними розмірами полягає в тому, що компоненти можуть бути неінтерпретованими. Таким чином, хоча косо обертання (тобто неортогональні розміри) технічно менше задовольняє таке обертання, іноді посилює інтерпретаційність отриманих компонентів.


4

Основні бали

  • Обертання може зробити інтерпретацію компонентів зрозумілішими
  • Косий обертання часто має більше теоретичного сенсу. Тобто, спостережувані змінні можна пояснити через меншу кількість співвіднесених компонентів.

Приклад

  • 10 випробовує всю вимірювальну здатність за допомогою певної вимірювальної вербальної та деякої вимірювальної просторової здатності. Усі тести взаємопов'язані, але взаємокореляція у вербальних або в просторових тестах більша, ніж у всіх тестах. Парсимонічний PCA може включати два корельовані компоненти, словесний та просторовий. Теорія та дослідження говорять про те, що ці дві здатності співвідносяться. Таким чином, косо обертання має теоретичний сенс.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.