Я буду вважати, що "категоріальна" змінна насправді означає порядкову змінну; інакше не має сенсу трактувати це як безперервне, якщо тільки це не двійкова змінна (закодована 0/1), як вказує @Rob. Тоді я б сказав, що проблема полягає не в тому, як ми ставимося до змінної, хоча до цього часу було розроблено багато моделей категоричного аналізу даних - див., Наприклад, Аналіз упорядкованих категоріальних даних: Огляд та опитування останніх події від Ля і Agresti--, ніж основна шкала вимірювання ми припускаємо. Моя відповідь буде зосереджена на цьому другому пункті, хоча я спочатку коротко обговорюю присвоєння числових балів змінним категоріям або рівням.
Використовуючи просте числове перекодування порядкової змінної, ви припускаєте, що змінна має інтервальні властивості (у сенсі класифікації, наданої Стівенсом, 1946). З точки зору теорії вимірювань (у психології) це часто може бути занадто сильним припущенням, але для базового дослідження (тобто, коли один предмет використовується для висловлення думки про щоденну діяльність з чітким формулюванням) будь-які монотонні оцінки повинні дати порівнянні результати . Кохран (1954) вже вказував на це
будь-який набір балів дає дійсний
тест за умови, що вони побудовані без консультацій з результатами експерименту. Якщо набір балів поганий, оскільки він погано спотворює числову шкалу, яка дійсно лежить в основі замовленої класифікації, тест не буде чутливим. Таким чином, бали повинні містити найкраще уявлення про спосіб побудови та використання класифікації. (стор. 436)
(Велика подяка @whuber за те, що він нагадував мені про це протягом одного з його коментарів, що призвело до того, що я перечитав книгу Агресті, з якої походить це цитування.)
М2М2= ( n - 1 ) r2
Ну, ви також можете вирішити перекодувати свою змінну в нерегулярному діапазоні або об'єднати деякі її рівні, але в цьому випадку сильний дисбаланс між перекодованими категоріями може спотворити статистичні тести, наприклад, вищезгаданий тренд-тест. Приємна альтернатива розподілу відстаней між категоріями вже запропонувала @Jeromy, а саме оптимальне масштабування.
Тепер давайте обговоримо другий пункт, який я зробив, основної моделі вимірювання. Я завжди вагаюся над тим, як додати тег «психометрика», коли бачу подібне питання, тому що побудова та аналіз вимірювальних шкал підпадають під Психометричну теорію (Nunnally and Bernstein, 1994, для акуратного огляду). Я не буду зупинятися на всіх моделях, які на насправді на чолі під пунктом теорії відгуку , і я люб'язно відсилаємо зацікавленого читача підручник І. Partchev в, Путівник по теорії відгуку елемента, для легкого вступу до IRT та до посилань (5-8), наведених наприкінці можливих таксономій IRT. Дуже коротко, ідея полягає в тому, що замість того, щоб призначати довільні відстані між змінними категоріями, ви припускаєте приховану шкалу і оцінюєте їх розташування на цьому континуумі разом з можливістю чи відповідальністю осіб. Простий приклад вартує багато математичних позначень, тому давайте розглянемо наступний пункт ( випливає з опитувальника якості якості життя EORTC QLQ-C30 ):
Ти хвилювався?
який кодується за чотирибальною шкалою, починаючи від "Зовсім не" до "Дуже багато". Неоцінені бали обчислюються шляхом присвоєння балу від 1 до 4. Оцінки за предметами, що належать до тієї самої шкали, потім можуть бути складені разом, щоб отримати так звану шкалу шкали, яка позначає ранг на базовій конструкції (тут компонент психічного здоров'я) ). Такі підсумовані бали за шкалою є дуже практичними через оцінку легкості (для практикуючого або медсестри), але вони є не більш ніж дискретною (упорядкованою) шкалою.
Можна також врахувати, що ймовірність схвалення даної категорії відповідей підпорядковується певній логістичній моделі, як описано в підручнику І. Парчева, згаданому вище. В основному, ідея полягає у такому вигляді порогової моделі (що призводить до еквівалентної формулювання з точки зору пропорційної або кумулятивної моделі шансів), і ми моделюємо шанси на те, щоб бути в одній категорії відповідей, а не попередньої або шансів на оцінку вище певна категорія, що залежить від місця розташування суб'єктів за прихованою ознакою. Крім того, ми можемо встановити, що категорії відповідей однаково розташовані за латентною шкалою (це модель шкали рейтингу) - що ми робимо, присвоюючи регулярно розміщені числові бали - чи ні (це модель часткового кредиту) .
Зрозуміло, ми не дуже додаємо Теорію класичного тестування, де порядкові величини трактуються як числові. Однак ми вводимо ймовірнісну модель, де ми припускаємо неперервну шкалу (з інтервальними властивостями) і де можна врахувати конкретні похибки вимірювання, і ми можемо підключити ці показники до будь-якої моделі регресії.
Список літератури
- Стів Стівенс. Про теорію шкал вимірювання. Наука , 103 : 677-680, 1946.
- χ2
- J Nunnally і я Бернштейн. Психометрична теорія . McGraw-Hill, 1994
- Алан Агрешті. Категоричний аналіз даних . Вілі, 1990.
- CR Rao та S Sinharay, редактори. Посібник зі статистики, Вип. 26: Психометрія . Elsevier Science BV, Нідерланди, 2007.
- A Boomsma, MAJ van Duijn та TAB Snijders. Нариси з теорії реагування на предмет . Спрингер, 2001.
- D Thissen та L Steinberg. Таксономія моделей реагування на елементи. Психометріка , 51 (4) : 567–577, 1986.
- P Mair і R Hatzinger. Розширене Rasch моделювання: МВК Пакет для застосування IRT моделей в R . Журнал статистичного програмного забезпечення , 20 (9) , 2007.