Чи завжди краще вилучати більше факторів, коли вони існують?


11

На відміну від аналізу основних компонентів, рішення моделей факторного аналізу не обов'язково вкладаються. Тобто, завантаження (наприклад) для першого коефіцієнта не обов'язково буде ідентичним, коли витягується лише перший коефіцієнт порівняно з колишніми двома чинниками.

Зважаючи на це, розглянемо випадок, коли у вас є набір змінних маніфестів, які сильно корелюються і (за теоретичним знанням їх змісту) повинні керуватися одним фактором. Уявіть, що аналіз дослідницьких факторів (за будь-якою метрикою ви надаєте перевагу: паралельний аналіз, графік обсипу, власне значення> 1 та ін.) Напевно підказує, що є фактори: великий первинний фактор і малий вторинний фактор. Ви зацікавлені у використанні маніфестних змінних та факторного рішення для оцінки (тобто отримання балів факторів) значень учасників для першого фактора. У цьому сценарії було б краще:2

  1. Встановіть факторну модель, щоб витягти лише коефіцієнт та отримати коефіцієнт фактора (тощо), або1
  2. підходить факторна модель для вилучення обох факторів, отримання факторних балів для факторів, але викинути / ігнорувати оцінки за другим фактором?

Чому б це було кращою практикою, чому? Чи є якісь дослідження з цього питання?


Не слід покладатися лише на доаналітичні евристичні прилади, вибираючи кількість факторів, які слід витягти. Відтворення кореляцій (наскільки краще, якщо витягувати 2 коефіцієнти замість 1?) Як розподіляються залишки кореляції у цьому та тому рішеннях? (вони, як правило, повинні бути рівномірними або нормальними, без довгого / жирного правого хвоста). Якщо дані нормальні, випробування на придатність та ст.помилки навантажень обчислюються (з вилученням МЛ). Виходячи з усього цього плюс інтерпретацію, можна вирішити, чи краще (1) чи (2) спосіб у цьому випадку кращий.
ttnphns

(продовження) Зрештою, лише нові зразки / підтверджуючі ФА можуть судити про дилему до кінця. Однак одне поняття. Якщо 2-й фактор дійсно слабкий (невеликі навантаження СС після видобутку), то я не очікую, що два рішення (а отже, і коефіцієнт коефіцієнта 1) сильно відрізнятимуться. (Я говорю це без особливої ​​впевненості, тому що я коментую без капітального ремонту. Але, логічно, якщо факторна площина готова перерости в лінію, результати повинні бути майже такими, як у простої лінії ...)
ttnphns

Заголовок Q Is is always better to extract more factors when they exist?не дуже зрозумілий. Завжди краще витягти стільки, скільки існує. Недостатня або придатна як спотворює "справжню" приховану структуру через багатоваріантність та невкладеність характеру зазначеного вами аналізу. Проблема полягає в тому, що ми точно не знаємо, скільки факторів є в наших даних. І чи цих даних є стільки, скільки має населення.
ttnphns

1
@ttnphns, ваш останній коментар потрапляє до основи питання, я думаю. Припустимо будь-які методи, які вам подобаються, щоб переконати вас у тому, що насправді є два фактори, 1 з яких становить майже всю спільну дисперсію, аж до включення CFA на свіжий зразок. Придатність ж / 2 незначно краще, але краще. Це підроблений та надуманий приклад задля висвітлення проблеми. Основна проблема може також використовувати 2 з 5.
gung - Відновити Моніку

1
Питання в тому, оскільки рішення не вкладені, який підхід дає кращу оцінку балу кожного учасника за латентною змінною, і чому? Використовує лише 1 упереджене, чи відрізняється воно далі від справжнього значення чи обох? Це трапляється тому, що використання лише 1 - це "недостатність"? Що це означає саме? Чи можна охарактеризувати характер викривлення? Крім того, я міг би очікувати, що вилучення лише 1 дозволяє аналізу зосередити всі його ступені свободи на тому, щоб отримати максимально точний 1-й.
gung - Відновіть Моніку

Відповіді:


5

Питання, на яке ви натякаєте, - це тема "наближеної одновимірності" при створенні інструментів психологічного тестування, про які в літературі обговорювалося досить небагато в 80-х. Натхнення існувало в минулому, оскільки практикуючі прагнули використовувати традиційні моделі теорії відгуків на предмет (IRT) для своїх предметів, і в той час ці моделі IRT були обмежені виключно вимірюванням одновимірних ознак. Отже, багатовимірність тесту, як сподівалося, буде неприємністю, яку (сподіваємось) можна уникнути або проігнорувати. Це також призвело до створення паралельних методів аналізу факторного аналізу (Drasgow and Parsons, 1983) та методів DETECT.

Наслідки ігнорування додаткових ознак / факторів, крім очевидного пристосування неправильної моделі до даних (тобто ігнорування інформації про потенційну невідповідність моделі; хоча це, звичайно, може бути тривіальним), полягає в тому, що оцінки ознак щодо домінуючого фактору стануть упередженими і тому менш ефективний. Ці висновки, звичайно, залежать від того, як властивості додаткових ознак (наприклад, вони співвідносяться з первинним виміром, чи мають вони сильні навантаження, скільки перехресних навантажень там тощо), але загальною темою є те, що вторинні оцінки для отримання первинних оцінок показники будуть менш ефективними. Дивіться технічний звіт тут для порівняння промаху обладнаної одновимірну моделі і модель бі-фактора; технічний звіт видається саме таким, за яким ви хочете.

З практичної точки зору використання інформаційних критеріїв може бути корисним при виборі найбільш оптимальної моделі, а також статистики відповідності моделі в цілому (RMSEA, CFI тощо), оскільки наслідки ігнорування багатовимірної інформації негативно вплинуть на загальну придатність до даних . Але звичайно, загальна відповідність моделі - лише одна ознака використання невідповідної моделі для даних, які є у вас; цілком можливо, що використовуються неправильні функціональні форми, такі як нелінійність чи відсутність монотонності, тому відповідні пункти / змінні завжди слід перевіряти.

Дивіться також :

Drasgow, F. and Parsons, CK (1983). Застосування моделей теорії реагування одновимірних елементів до багатовимірних даних. Прикладне психологічне вимірювання, 7 (2), 189-199.

Drasgow, F. & Lissak, RI (1983). Модифікований паралельний аналіз: Процедура вивчення прихованої розмірності відповідей предмета, що має дихотомічний результат. Журнал прикладної психології, 68, 363-373.

Левент Кіріші, Це-чі Хсу та Ліфа Ю (2001). Надійна програма оцінок параметрів предмета до припущень про одномірність та нормальність. Прикладне психологічне вимірювання, 25 (2), 146-162.


Дякуємо, що додали це. Це, здається, саме те, про що я пішов.
gung - Відновіть Моніку

Чи правильно я розумію, що ваша відповідь на заголовок питання "Так"?
амеба

2
@amoeba взагалі, я б сказав, що так, або більше того, що, включаючи додаткову інформацію, може робити і краще, або краще, ніж нав'язувати сувору одновимірність. Ігнорування відомої багатовимірності може бути дуже проблематичним, але, звичайно, цьому сприятиме ряд факторів. Єдиний час, включаючи додаткову інформацію про структуру, може бути поганим, коли розмір вибірки занадто малий, щоб стабільно оцінити додаткові параметри; таким чином, упередження ефективності компромісу. Але, якщо розмір вибірки не є великою проблемою, то я б сказав, що втратити мало, включаючи додаткову інформацію (але багато чого втратити, якщо ні).
філхальмери

1

Якщо ви справді не хочете використовувати другий фактор, вам слід просто використовувати однофакторну модель. Але я здивований вашим зауваженням, що навантаження першого фактора зміниться, якщо ви будете використовувати другий коефіцієнт.

х-х

Далі для пояснення наслідків обертання. Я не добре малюю, тому спробую переконати вас, використовуючи слова. Я припускаю, що ваші дані (приблизно) нормальні, так що показники коефіцієнтів також приблизно нормальні. Якщо витягуєте один фактор, ви отримуєте одновимірний нормальний розподіл, якщо витягуєте два фактори, ви отримуєте біваріантний нормальний розподіл.

Щільність біваріантного розподілу виглядає приблизно як капелюх, але точна форма залежить від масштабування, а також коефіцієнта кореляції. Тож припустимо, що кожен з двох компонентів має одиничну дисперсію. У неспорідненому випадку ви отримуєте гарне сомбреро з рівними кривими, схожими на кола. Зображення тут . Кореляція «розчісує» шапку, щоб вона більше нагадувала шапку Наполеона .

Припустимо, що ваш початковий набір даних мав три виміри, і ви хочете витягти з цього два фактори. Будемо також дотримуватися нормальності. У цьому випадку щільність - це чотиривимірний об'єкт, але криві рівня є тривимірними і принаймні їх можна візуалізувати. У неспорідненому випадку криві рівня є сферичними (як футбольний м'яч). За наявності кореляції криві рівня знову будуть перекручені, у футбол, ймовірно, недостатньо надутий, так що товщина в швах буде меншою, ніж товщина в інших напрямках.

Якщо ви вилучаєте два фактори за допомогою PCA, ви повністю розгладжуєте футбол в еліпс (і проектуєте кожну точку даних на площину еліпса). Перший фактор, що не позначається, відповідає довгій осі еліпса, другий фактор перпендикулярний до нього (тобто короткої осі). Потім обертання вибирає систему координат у межах цього еліпса , щоб задовольнити деякі інші зручні критерії.

Якщо витягуєте лише один коефіцієнт, обертання неможливо, але ви гарантуєте, що витягнутий коефіцієнт PCA відповідає довгій осі еліпса.


2
Мені спантеличена ця відповідь. Питання прямо задається питанням факторного аналізу, на відміну від аналізу основних компонентів.
амеба

Існує два способи вилучення факторів: основні компоненти або максимальна ймовірність. Я не робив жодної статистики щодо цього, але вважаю, що метод основного компонента використовується частіше.
користувач3697176

3
Існує маса різних методів, більше двох. Основна вісь, ML, міни, найменше зважені квадрати та інше - я тут не експерт. PCA, можливо, іноді (рідко!) Також вважається методом вилучення факторів, але це зовсім неохайно - цього насправді не повинно бути. Він підходить для іншої моделі.
амеба

Ваше перше речення стосується мого питання Q. Було б добре почути більше про те, чому це може бути правильним. Щодо методів вилучення факторів, @amoeba має рацію: PCA & PAF були загальними явищами, коли інші алгоритми не були настільки добре розроблені або важко реалізовані. Зараз вони широко вважаються неповноцінними. R в , fa()наприклад , не використав їх в протягом багатьох років. Інші методи дадуть невкладені рішення, що легко перевірити з програмним забезпеченням та набором даних FA. Для порівняння ви можете вважати обидва рішення невписаними. FWIW, я знайомий з ідеєю сферичних та еліптичних розподілів MVN.
gung - Відновіть Моніку

1
@gung, зауваження. Метод PAF також дає невкладені рішення. Це добросовісний метод FA (хоч і заснований на PCA як методі) і, я думаю, все ще широко використовується.
ttnphns

1

Чому б ви не використовували щось на зразок lavaan або MPlus для запуску двох моделей (одновимірна модель та двовимірна модель, вирівняна за вашими результатами EFA) та порівнювали відносні та абсолютні показники відповідності різних моделей (тобто інформаційні критерії - AIC та BIC, RMSEA, SRMR, CFI / TLI)? Зауважте, що якщо ви йдете цією дорогою, ви не хочете використовувати PCA для EFA, а основні фактори. Хтось, хто насправді займається вимірюванням, вклав би КФА в повну модель структурного рівняння.

Редагувати: підхід, який я прошу вас розглянути, стосується більше того, щоб з'ясувати, скільки прихованих змінних насправді пояснюють набір елементів. Якщо ви хочете отримати найкращу оцінку більшого коефіцієнта, я би проголосував за використання коефіцієнта фактора з моделі CFA з кращим підходом, що б це не було.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.