Сума рейтингових балів проти розрахункових коефіцієнтів?


12

Мені буде цікаво отримати пропозиції про те, коли слід використовувати " коефіцієнт " над простою сумою балів при побудові шкал. Тобто "Вишуканий" над "нерафінованими" методами оцінки коефіцієнта. Від DiStefano та ін. (2009; pdf ), наголос додано:

Існує два основні класи методів обчислення факторної оцінки: вдосконалений та неочищений. Неочищені методи - це відносно прості, кумулятивні процедури для надання інформації про розміщення осіб на розподіл факторів. Простота піддається деяким привабливим особливостям, тобто не уточнені методи одночасно легко обчислити і легко інтерпретувати. Вдосконалені методи обчислення створюють факторні бали, використовуючи більш складні та технічні підходи. Вони є більш точними та складними, ніж неочищені методи, і дають оцінки, які є стандартизованими балами.

На мій погляд, якщо мета полягає у створенні шкали, яка може бути використана для досліджень та установок, то проста сума або середня оцінка всіх предметів шкали має сенс. Але скажімо, що мета полягає в тому, щоб оцінити ефекти лікування програми, і важлива контрастність знаходиться в межах вибірки - лікування та контрольна група. Чи є якась причина, чому ми можемо віддавати перевагу коефіцієнтам, щоб оцінювати суми чи середні показники?

Щоб бути конкретним щодо альтернатив, візьміть цей простий приклад:

library(lavaan)
library(devtools)

# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
  gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
  source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
  head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1  3  4  3  4  3  3  4  4  3
# 2  2  1  2  2  4  3  2  1  3
# 3  1  3  4  4  4  2  1  2  2
# 4  1  2  1  2  1  2  1  3  2
# 5  3  3  4  4  1  1  2  4  1
# 6  2  2  2  2  2  2  1  1  1

# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf

# non-refined -----------------------------------------------------------------
  mydata$sumScore <- rowSums(mydata[, 1:9])
      mydata$avgScore <- rowSums(mydata[, 1:9])/9
  hist(mydata$avgScore)

# refined ---------------------------------------------------------------------
  model <- '
            tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
           '
  fit <- sem(model, data = mydata, meanstructure = TRUE,
             missing = "pairwise", estimator = "WLSMV")
  factorScore <- predict(fit)
  hist(factorScore[,1])

Я усунув «втручання» з назви, щоб зробити питання більш загальним і тому, що втручання, можливо, не мають унікального, конкретного стосунку до розмежування двох видів розгляду конструкцій. Будь ласка, ви можете прокрутити мою редакцію, якщо ви не згодні.
ttnphns

1
They are more exactЦей додатковий наголос не повинен відволікати нас від того, що навіть факторні бали неминуче є неточними ("недостатньо визначеними").
ttnphns

Дивіться також подібне запитання: stats.stackexchange.com/q/31967/3277 .
ttnphns

Я вважаю, що «втручання» є актуальними як окремий випадок використання, але це не повинно бути в назві. Я виділив ключове питання у питанні. Щодо акцентів на "точніші", мені цікаво було думати про цю точку, враховуючи спостереження, які ви робите щодо оцінки факторів, невизначені. Дякуємо за посилання на інші запитання.
Ерік Грін

"more exact". Серед лінійно обчислених оцінок коефіцієнтів регресійний метод найбільш "точний" в сенсі "найбільш корельований з невідомими істинними значеннями фактора". Так, так, точніше (в рамках лінійного алгебраїчного підходу), але не зовсім точне.
ttnphns

Відповіді:


6

Я боровся з цією ідеєю в деяких поточних проектах. Я думаю, вам потрібно запитати себе, що тут оцінюється. Якщо однофакторна модель підходить, то коефіцієнт коефіцієнта оцінює латентний коефіцієнт. Пряма сума або середнє значення ваших змінних маніфесту оцінює щось інше, якщо тільки кожне спостереження не навантажує однаково на фактор, і однозначності також однакові. І це щось інше, мабуть, не є великим теоретичним інтересом.

Тож якщо однофакторна модель підходить, вам, ймовірно, добре рекомендується використовувати коефіцієнт фактора. Я приймаю Вашу думку про порівнянність між дослідженнями, але в рамках конкретного дослідження я думаю, що факторні показники багато для них підходять.

Де цікаво, коли однофакторна модель не підходить, або тому, що застосовується двофакторна модель (або вище), або тому, що структура коваріації є складнішою, ніж прогнозує факторна модель. Для мене питання тоді полягає в тому, чи пряма сукупність змінних відноситься до чогось реального. Це особливо вірно, якщо дані мають більше одного виміру. На практиці часто трапляється те, що у вас є купа пов’язаних змінних (можливо, пунктів опитування), причому одна або дві з них відрізняються від інших. Ви можете сказати «до пекла з цим» і взяти середнє все, незалежно від того, що це означає. Або ви можете піти з факторними балами. Якщо вам підходить однофакторна модель, то, як правило, трапляється, що факторний аналіз знизить менше корисних змінних (або, принаймні, тих змінних, які дійсно належать до другої оцінки факторів). По суті, він визначає їх як належність до іншого виміру та ігнорує їх.

Тому я вважаю, що коефіцієнт коефіцієнта може надати певний обріз даних, щоб дати щось більш одномірне, ніж ви починали. Але у мене немає посилання на це, і я все ще намагаюся розібратися у власній роботі, чи подобається мені такий підхід. Для мене велика небезпека - це надмірна небезпека, коли ти закладаєш оцінки в іншу модель з тими ж даними. Оцінки вже є відповіддю на питання оптимізації, і де це залишає решта аналізу? Я ненавиджу думати.

Але наприкінці дня чи має значення сума чи сума змінних насправді, якщо щось на зразок однофакторної моделі не застосовується?

Дуже багато таких питань не виникло, якби люди розробили кращі масштаби для початку.


Я вдячний за ваші коментарі, @Placidia. Ви вносите деяку ясність, нагадуючи нам про більший безлад! Я думаю, що це цікавий момент, який слід врахувати: "Якщо факторна модель підходить, то показники коефіцієнта оцінюють латентний коефіцієнт. Пряма сума або середнє значення ваших маніфестних змінних оцінює щось інше, якщо тільки кожне спостереження не навантажує однаково на коефіцієнт і унікальність теж однакова. І те, що щось інше, мабуть, не є великим теоретичним інтересом ".
Ерік Грін

+1 за дуже продуману відповідь. Кілька думок додати: 1) щодо порівнянності між дослідженнями, важливо визнати, що на відміну від навантажень компонентів - які можуть змінитись у значній мірі у відповідь на змінні, включені / виключені з моделі, - загальні факторні навантаження - це оцінка параметрів. Згодом вони повинні повторюватись (в межах помилки вибірки) від дослідження до дослідження, і, таким чином, також слід оцінювати коефіцієнт. 2) Якщо ви стурбовані використанням факторних балів, ви можете подивитися на показники визначеності та наскільки добре співвідношення ваших факторів відображає приховані кореляції ...
jsakaluk

1
... оскільки я думаю, що це стратегія, обговорювана в DiStefanno et et. ін. документ, щоб оцінити, чи можна оцінювати фактор "довіряти". І, нарешті, 3) якщо ваша мета, як описує Плакідія, - проаналізувати щось, що значною мірою одновимірне, ви можете розглянути підхід двофакторного аналізу, який, як я розумію, спочатку витягує загальний фактор, на який завантажується кожна змінна, а потім наступний ортогональний фактори виділяються для підмножини змінних, які нібито відображають найважливіші фактори, що відрізняються, поза загальним виміром, що пов'язує всі змінні разом.
jsakaluk

Плацидія, в останній редакції своєї відповіді ви неодноразово стримуєте себе висловом one-factor model. Мені просто цікаво, чому. Ви хочете сказати, що в двофакторній моделі бальні показники вже не estimate the latent factor? Чому так? А також, як ви визначаєте "однофакторну модель" в контексті анкети, що розробляється (ймовірний контекст Q): чи опитувальник є однофакторним / масштабним чи що кожен включений елемент рахується, що належить строго одному фактору / масштаб? Будь ласка, чи не заперечуєте це зробити більш зрозумілим?
ttnphns

Я хотів уникнути потенційного непорозуміння. Якщо ви вірите в двофакторну модель, імовірно використання підсумкових підсумків було б поза таблицею. Вам потрібно два зведення для двох вимірів у даних. Я хотів уточнити, що моя відповідь стосувалася вибору між підсумковою статистикою та факторною оцінкою однофакторної моделі. Я стверджую, що однофакторна оцінка може бути корисною, навіть якщо модель помилкова. Пропозиція @ jsakaluk щодо встановлення багатофакторної моделі та вибору першого коефіцієнта також можлива, а в деяких випадках може бути кращою.
Placidia

4

Підсумовування або усереднення елементів, завантажених загальним фактором, є традиційним способом підрахунку найбільшої оцінки (конструкції, що представляє коефіцієнт tha). Це найпростіший варіант "грубого методу" обчислення балів факторів ; Основна суть методу полягає у використанні факторних навантажень як бальних ваг. Хоча вдосконалені методи обчислення балів використовують спеціально оцінені коефіцієнти балів (обчислені з навантажень) як ваги.

Ця відповідь не є універсальним "підказує, коли слід використовувати [уточнені] коефіцієнти над простою сумою балів предметів", що є великою областю, але фокусується на показанні певних очевидних наслідків, що стосуються переваги одного способу рахування конструкції над іншим. шлях.

Розглянемо просту ситуацію з деяким фактором і двома завантаженими ним елементами. Згідно виносці 1 тут пояснити , як регресивні оцінки фактора обчислюють коефіцієнти фактора оцінки б 1 і б 2 для обчислення коефіцієнта безлічі F приходять зЖб1б2Ж

,с1=б1r11+б2r12

,с2=б1r12+б2r22

с1с2r12ббб

rr11r22

б1=с2r12-с1r122-1

б2=с1r12-с2r122-1

б1-б2=-(r12+1)(с1-с2)r122-1.

бсr12б1-б2

введіть тут опис зображення

введіть тут опис зображення

с1-с2=0бс1-с2б1-б2r12

б

с1=.70с2=.45.25

c. Якщо вони сильно співвідносяться, більш слабкий завантажений елемент - це молодший дублікат іншого. Яка причина вважати, що слабший показник / симптом у вигляді його сильнішого замінника? Немає великої причини. І коефіцієнт коригує для цього (в той час як просте підсумовування не робить). Зауважте, що у багатофакторному опитувальнику "слабкіше завантажений предмет" часто є іншим фактором, завантажений там вище; в той час як у нинішньому факторі цей пункт затримується, як ми бачимо зараз, при обчисленні факторних балів, - і це служить правильно.

б. Але якщо предмети, завантажені, як і раніше, нерівномірно, не сильно співвідносяться, то вони є для нас різними показниками / симптомами. І можна було б порахувати «двічі», тобто просто підсумувати. У цьому випадку показники коефіцієнта намагаються поважати слабший предмет настільки, наскільки його завантаження все ще дозволяє, оскільки він є іншим варіантом здійснення коефіцієнта.

а. Два пункти також можна порахувати двічі, тобто просто підсумувати, коли вони мають схожі, досить високі, завантаження за коефіцієнтом, незалежно від кореляції між цими пунктами. (Оцінки факторів додають більшої ваги обом предметам, коли вони співвідносяться не надто жорстко, проте ваги рівні.) Здається, що це нерозумно, як правило, ми допускаємо або допускаємо досить повторювані предмети, якщо всі вони сильно завантажені. Якщо вам це не подобається (іноді, можливо, ви захочете), ви коли-небудь можете усунути дублікати з фактора вручну.

введіть тут опис зображення

Так, при обчисленні (вдосконалених) балів факторів (принаймні методом регресії) є очевидними інтриги "ужитися / витіснити" серед змінних, що складають конструкцію, під впливом їх на бали . Настільки ж сильні показники переносять один одного, як і нерівні сильно не сильно співвідносні. "Вимкнення" відбувається за слабшого показника, сильно співвіднесеного з більш сильними показниками. Просте додавання / усереднення не має інтриги "витіснити слабкий дублікат".

Будь ласка, дивіться також цю відповідь, яка заперечує, що цей фактор теоретично є скоріше "сутністю всередині", ніж грубою колекцією чи купою "її" показових явищ. Тому сліпо підбивати підсумки - не беручи до уваги ні їх навантаження, ні їх кореляції - потенційно проблематично. З іншого боку, коефіцієнт, як забитий, може бути лише якоюсь сумою його предметів, і тому все стосується кращого уявлення про ваги в сумі.


Давайте також розглянемо дефіцит грубого або підсумовування методу більш загально та абстрактно .

ба

Ж^iiЖiХ1Х2а1а2ЖUб

Ж^i=б1Х1i+б2Х2i=б1(Жi+U1i)+б2(Жi+U2i)=(б1+б2)Жi+б1U1i+б2U2i

б1U1i+б2U2iЖ^iЖiUЖ^Жбвар[б1U1i+б2U2i]Ж^ЖбаХЖ^Ж

абЖЖ^

Ж^i=а1Х1i+а2Х2i= ... =(а1+а2)Жi+а1U1i+а2U2i

бааа


Дякую, @ttnphns, за корисну відповідь. Для мене є сенс, що предмети з приблизно рівними навантаженнями можна було просто підсумовувати (а). На жаль, я не думаю, що в своїй роботі я жодного разу не стикався з ситуацією, коли під час використання наявної шкали, яка нібито невимірна, я виявляю, що елементи мають однакові навантаження.
Ерік Грін

Тому мене особливо зацікавило ваше пояснення ситуації, коли навантаження відрізняються, і пропозиція вивчити міжпозиційні кореляції. Мені цікаво знати, чи є у вас якісь правила щодо "сильних" (с) / "не сильних" кореляцій (б) або "досить високих" навантажень в (а).
Ерік Грін

1
Насамкінець зазначу, що задля цього питання є надзвичайною дисциплінарною нормою (принаймні, з психології) для використання "перевірених" шкал, які потребують простих сум (середніх), навіть при призначенні шкали новому ненормованому населенню. Найчастіше метою є порівняльні вибіркові порівняння (навіть якщо вони не мають підстави), що робить прості суми загальним підходом.
Ерік Грін

Дослідження втручання є моїм цікавим випадком використання, оскільки порівняння інтересів знаходиться в межах вибірки. Мені здається, що ми більше піклуємося про розмір ефекту від лікування, ніж будь-яка група «сировинних» балів за мірою, особливо коли використовується шкала поза межами населення, що використовується для розробки / норми шкали. Якщо показники факторів у деяких ситуаціях "кращі", то, здається, варто відкинути простий підхід на користь того, який має більш концептуальний сенс, знаючи, що в кінцевому підсумку ми просто хочемо подивитися на розміри ефекту від лікування.
Ерік Грін

1
(продовження) Use "validated" scalesне вимагає обов'язково простих сум: якщо перевірка була хорошою (репрезентативна велика вибірка, хороша кореляція, правильна кількість факторів, хороша відповідність тощо), обчислені бали коефіцієнтів (їх коефіцієнти) можна вважати нормативними ваги для використання в нових групах населення. У цьому відношенні я не бачу жодної переваги у простій сумі.
ttnphns
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.