Найкращі методи вилучення фактора в факторному аналізі


29

SPSS пропонує кілька методів вилучення факторів:

  1. Основні компоненти (що зовсім не факторний аналіз)
  2. Невагомі найменші квадрати
  3. Узагальнені найменші квадрати
  4. Максимальна ймовірність
  5. Основна вісь
  6. Альфа-факторинг
  7. Імідж-факторинг

Ігноруючи перший метод, який не є факторним аналізом (а основним компонентним аналізом, PCA), який із цих методів є "найкращим"? Які відносні переваги різних методів? І в основному, як я б обрав, який з них використовувати?

Додатковий запитання: чи слід отримувати подібні результати з усіх 6 методів?


Хм, мій перший імпульс: чи не є в цьому вікіпедії запис? Якщо ні - напевно, має існувати такий ...
Готфрід Гельмс

4
Так, є стаття у Вікіпедії. Він говорить, що використовувати MLE, якщо дані є нормальними, а PAF - в іншому випадку. Це не говорить багато про достоїнства чи інше про інші варіанти. У будь-якому випадку, я був би радий дізнатися, що думають члени цього веб-сайту щодо цього питання, виходячи з їх практичного досвіду.
Placidia

Відповіді:


41

Щоб було коротко. Два останніх методи є дуже особливими і відрізняються від чисел 2-5. Всі вони називаються загальним факторним аналізом і насправді розглядаються як альтернатива. Здебільшого вони дають досить схожі результати. Вони є "загальними", оскільки вони представляють класичну факторну модель , загальні фактори + модель унікальних факторів. Саме ця модель зазвичай використовується при аналізі / валідації анкети.

Основна вісь (PAF) , також головний фактор з ітераціями, є найдавнішим і, мабуть, досить популярним методом. Ітераційне застосування PCA 1 до матриці, коли спільноти стоять на діагоналі замість 1s або відхилень. Кожна наступна ітерація, таким чином, ще більше вдосконалює громади, поки вони не зближуються. При цьому метод, який прагне пояснити дисперсію, а не парні кореляції, врешті-решт пояснює кореляції. Перевага основної осі має перевагу в тому, що він може, як і PCA, аналізувати не тільки кореляції, але й коваріації та інші1Заходи SSCP (сирий sscp, косинуси). Решта три методи обробляють лише кореляції [в SPSS; covariances можна було б проаналізувати в деяких інших реалізаціях]. Цей метод залежить від якості початкових кошторисів комунальних послуг (і це є його недоліком). Зазвичай в якості вихідного значення використовується квадратне множинне співвідношення / коваріація, але ви можете віддати перевагу іншим оцінкам (включаючи оцінки, взяті з попередніх досліджень). Будь ласка, прочитайте це для отримання додаткової інформації. Якщо ви хочете побачити приклад обчислень основного осевого коефіцієнта, прокоментовані та порівняні з обчисленнями PCA, будь ласка, подивіться тут .

2

34

Максимальна ймовірність (ML)припускає, що дані (кореляції) надходили від популяції, що має багатофакторний нормальний розподіл (інші методи не припускають такого припущення), і, отже, залишки коефіцієнтів кореляції повинні бути нормально розподілені приблизно 0. Навантаження ітераційно оцінюється методом підходу МЛ за вищенаведеним припущенням. Обробка кореляцій зважується уніфікованістю так само, як і в методі Узагальнених найменших квадратів. Хоча інші методи просто аналізують вибірку таким, яким він є, метод ML дозволяє зробити певний висновок про сукупність, поряд з ним зазвичай обчислюється ряд відповідних індексів та довірчих інтервалів [на жаль, переважно не в SPSS, хоча люди писали макроси для SPSS, які роблять це].

Усі методи, які я коротко описав, - це лінійна безперервна латентна модель. "Лінійний" означає, що кореляційні кореляції, наприклад, не повинні аналізуватися. "Постійне" означає, що бінарні дані, наприклад, не повинні аналізуватися (IRT або FA на основі тетрахорних кореляцій було б більш доцільним).


1R

2у2

3уR-1уу-1Rу-1

4

введіть тут опис зображення


Думаю, слід додати ще один аспект: чи ми використовуємо методи, щоб підходити до факторного рішення до заданої кількості факторів, або чи має кількість факторів виходити з даних, за яким-небудь критерієм (власне значення, показник екрану, ...) . Як я розумію, ML є сенситивним лише за умови уточнення ряду факторів, і тоді буде шукано факторне рішення, і навіть тоді можливий тест на чи-квадрат. PCA дозволяє число факторів, що динамічно з'являються за властивостями даних, з урахуванням певного критерію, без тестування на квадратний чи. PAF можна використовувати обома способами.
Готфрід Гельмс

1
@Gottfried, я скоріше не погоджуюся з тим, як ти це виклав. Усі методи FA вимагають того, щоб було відомо кількість факторів m : ви підходите до моделі для вказаного м m . Можна використовувати різні критерії, які можуть допомогти визначитися з m , але все це не є частиною самих методів вилучення факторів. За винятком цього квадратного чи, обчисленого разом із методами GLS та ML. Крім того, за допомогою методу ПА, якщо ви знаєте справжні громади заздалегідь (що дуже рідко), ви можете змусити їх направляти вас до кращого м . Але в будь-якому випадку, його ти, а не алгоритм видобутку, вирішує на m .
ttnphns

Тепер, що нам використовувати? Який із них найкращий?
MrYouMath

1
Найкраще - це те, що тобі найбільше подобається. Ви вибираєте, то при необхідності поясніть, чому це вам підходить. Як скрізь.
ttnphns

@ ttnphns, чи є принцип when to use which?
kittygirl
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.