Я припускаю, що вашу анкету слід розглядати як одну одновимірну шкалу (інакше альфа Кронбаха не має особливого сенсу). Варто провести дослідницький аналіз факторів, щоб перевірити це. Це також дозволить вам побачити, як елементи відносяться до масштабу (тобто, через їх завантаження).
Основні кроки для перевірки ваших елементів та масштабу повинні включати:
- повний звіт про основні статистичні дані пунктів (діапазон, квартілі, центральна тенденція, ефекти стелі та підлоги, якщо такі є);
- перевірка внутрішньої узгодженості, як ви це зробили з альфа (найкраще, надайте 95% довірчі інтервали, оскільки це залежить від вибірки);
- опишіть вам підсумкову оцінку (наприклад, загальний чи середній бал, також шкала шкали) із звичайними статистичними даними (гістограма + щільність, квантили тощо);
- перевіряйте свої зведені відповіді на конкретні коваріати, які повинні бути пов'язані з оцінкою, яку ви оцінюєте - це називається дійсності відомої групи;
- якщо можливо, перевірте свої зведені відповіді на відомі інструменти, які мають намір виміряти ту саму конструкцію ( паралельна чи збіжна валідність).
Якщо ваша шкала не є одновимірною, ці кроки потрібно виконати для кожної підшкали, і ви також можете виділити кореляційну матрицю ваших факторів для оцінки структури факторів другого порядку (або використовувати структурне моделювання рівнянь, або підтверджуючий аналіз факторів, або що завгодно). Ви також можете оцінити конвергентну та дискримінантну обґрунтованість, використовуючи багатокористувацьке масштабування або багатодітне багатоточне моделювання (засноване на проміжних кореляціях всередині і між масштабами) або, знову ж таки, SEM.
Тоді я б сказав, що Теорія відповідей на предмет не допоможе настільки, якщо ви не зацікавлені в скороченні анкети, відфільтруванні деяких елементів, які показують функціонування диференціальних елементів , або використанні вашого тесту в якомусь комп’ютерному адаптивному тесті .
У будь-якому випадку модель Rasch призначена для бінарних предметів. Для багатотомних упорядкованих елементів найчастіше використовуються моделі:
- модель градуйованого реагування
- модель часткового кредитування
- модель рейтингової шкали.
Тільки останні два з родини Раш, і вони в основному використовують суміжну формулу шансів, з думкою, що суб'єкт повинен "пройти" кілька порогових знаків, щоб схвалити дану категорію відповідей. Різниця між цими двома моделями полягає в тому, що ПКМ не нав'язує, що пороги однаково розташовані за тета- шкалою ( здатність або розташування предмета за латентною ознакою). Модель градуйованого відгуку спирається на формулювання кумулятивного шансу. Майте на увазі, що всі ці моделі припускають, що масштаб одномірний; тобто є лише одна прихована ознака. Існують додаткові припущення, наприклад, місцева незалежність (тобто співвідношення між відповідями пояснюються варіацією за шкалою можливостей).
У всякому разі, ви знайдете дуже повну документацію і корисні підказки для застосування психометричних методів в R в обсязі 20 Журналу статистичного програмного забезпечення: Спеціальний Обсяг: психометрії в R . В основному, найцікавіші пакети R, які я використовую у своїй щоденній роботі, є: ltm , eRm , psych , psy . Інші посилання посилаються на Психометрію подання завдання CRAN . Інші цікаві ресурси:
Хороший огляд використання ФА проти ІРТ у розробці масштабів можна знайти у побудові шкали та оцінці на практиці: огляд факторного аналізу порівняно із застосуванням теорії реагування на предмет , десятьох Хольт та ін. (Психологічне моделювання тестів та оцінювання (2010)) 52 (3): 272-297).