Які хороші основні статистичні дані використовувати для порядкових даних?


67

У мене є деякі порядкові дані, отримані з питань опитування. У моєму випадку це відповіді у стилі Лікерта (категорично не погоджуюсь-не погоджуюся-нейтрально-погоджуюся - сильно погоджуюсь). У моїх даних вони кодуються як 1-5.

Я не думаю, що засоби означатимуть тут багато чого, тому яка основна підсумкова статистика вважається корисною?


2
Поширені варіанти включають - медіани, режими, пропорції або сукупні пропорції в кожній групі
Glen_b

Відповіді:


29

Таблиця частот - це гарне місце для початку. Ви можете робити підрахунок та відносну частоту для кожного рівня. Також можуть бути корисними загальна кількість та кількість відсутніх значень.

Ви також можете використовувати таблицю надзвичайних ситуацій для порівняння двох змінних одночасно. Можна відображати і за допомогою мозаїчного сюжету.


32

Я збираюся стверджувати з прикладної точки зору, що середня часто є найкращим вибором для узагальнення центральної тенденції елемента Лікерта. Зокрема, я маю на увазі такі контексти, як опитування задоволеності студентів, масштаби дослідження ринку, опитування думок працівників, тести особистості та багато предметів опитування соціальних наук.

У таких умовах споживачі досліджень часто хочуть відповіді на такі питання:

  • Які твердження мають більш-менш згоду щодо інших?
  • Які групи більше чи менше погоджувались із заданим твердженням?
  • З часом згода знизилася чи знизилася?

Для цих цілей засіб має ряд переваг:

1. Середнє значення легко обчислити:

  • Легко помітити взаємозв'язок між необробленими даними та середніми.
  • Це прагматично легко підрахувати. Таким чином, середина може бути легко вбудована в системи звітності.
  • Це також полегшує порівнянність між контекстами та налаштуваннями.

2. Середовище відносно добре зрозуміле та інтуїтивне:

  • Середнє значення часто використовується для повідомлення центральної тенденції предметів Лікерта. Таким чином, споживачі досліджень з більшою ймовірністю розуміють середину (і, таким чином, їй довіряють, і діють на неї).
  • Деякі дослідники віддають перевагу, мабуть, навіть більш інтуїтивно зрозумілим варіантом повідомлення про відсоток вибірки, що відповідає 4 або 5. Тобто, він має відносно інтуїтивне тлумачення "відсоткової згоди". По суті, це лише альтернативна форма середнього, з 0, 0, 0, 1, 1кодуванням.
  • Також з часом споживачі досліджень вибудовують орієнтири. Наприклад, коли ви порівнюєте свою навчальну ефективність з року в рік або за окремими предметами, ви формуєте нюансове відчуття того, що означає середнє значення 3,7, 3,9 або 4,1.

3. Середнє значення - це одне число:

  • Одне число є особливо цінним, коли ви хочете подавати претензії на кшталт "студенти були більш задоволені предметом X, ніж предметом Y".
  • Емпірично я також вважаю, що єдине число є фактично основною інформацією, що цікавить предмет Лікерта. Стандартне відхилення, як правило, пов'язане з тим, наскільки середнє значення наближається до центральної оцінки (наприклад, 3,0). Звичайно, емпірично це може не застосовуватися у вашому контексті. Наприклад, я десь читав, що коли рейтинги You Tube мали зіркову систему, було велика кількість або найнижчого, або найвищого рейтингу. З цієї причини важливо перевірити частоту категорій.

4. Це не має великої різниці

  • Хоча я офіційно цього не перевіряв, я б припустив, що для порівняння рейтингів центральної тенденції для предметів або груп учасників або з часом будь-який розумний вибір масштабування для генерування середнього дасть подібні висновки.

4
Гарний пост! Чи маєте ви думки про те, як різні культури / країни можуть використовувати масштаби лікерту, що кардинально вплине на такі результати?
Чейз

@chase Є дослідження з цього приводу, але минуло певний час, як я його переглянув. Ось приклад пошуку в Google вченого scilar.google.com.au/…
Джеромі Англім

Я погоджуюся з виправданням пана Джеромія Англіма щодо використання середнього (тобто середньозваженого значення, щоб бути точним) як найнадійнішої неупередженої більш описової інтерпретації впорядкованих категоричних змінних, таких як використання шкали Лікерта, де кожна з точок даних сприяє підсумкова середня.


28

Щодо основних підсумків, я погоджуюся, що таблиці частот звітності та певні вказівки про центральну тенденцію є нормальними. Для висновку, нещодавня стаття, опублікована в PARE, обговорювала t-vs. MWW-тест, Five-Point Likert items : t-тест проти Mann-Whitney-Wilcoxon .

Для більш досконалого лікування я рекомендую прочитати огляд Agresti про впорядковані категоричні змінні:

Лю, Y і Agresti, A (2005). Аналіз упорядкованих категоріальних даних: Огляд та опис останніх подій . Sociedad de Estadística e Investigación Operativa Test , 14 (1), 1-73.

Він значною мірою виходить за рамки звичайних статистичних даних, таких як порогова модель (наприклад, пропорційне співвідношення шансів), і її варто прочитати замість CDA- книги Агресті .

Нижче я показую зображення трьох різних способів поводження з предметом Лікерта; зверху вниз, перегляд "частоти" (номінальний), "числовий" і "ймовірнісний" вид ( часткова кредитна модель ):

alt текст

Дані надходять із Scienceданих у ltmпакеті, де деталь стосувався технології ("Нова технологія не залежить від базових наукових досліджень", у відповідь "категорично не згоден" на "категоричну згоду" за чотирибальною шкалою)


14

Звичайна практика полягає у використанні непараметричної суми рангів і середнього рангу для опису порядкових даних.

Ось як вони працюють:

Сума рейтингу

  • присвоїти звання кожному члену в кожній групі;

  • наприклад, припустимо, що ви переглядаєте цілі кожного гравця на двох протилежних футбольних командах, а потім оцінюйте кожного члена в обох командах від першого до останнього;

  • обчислити суму рангів, додавши ранги по групі ;

  • величина рангової суми говорить вам про те, наскільки зближені ранги для кожної групи

Середній ранг

M / R є більш досконалою статистикою, ніж R / S, оскільки вона компенсує неоднакові розміри в групах, які ви порівнюєте. Отже, крім вищезазначених етапів, ви ділите кожну суму на кількість членів у групі.

Якщо у вас є ці дві статистичні дані, ви можете, наприклад, z-перевірити рангову суму, щоб побачити, чи є різниця між двома групами статистично значущою (я вважаю, що це відоме як тест суми рангів Вілкоксона , який є взаємозамінним, тобто функціонально еквівалент тесту Манна-Вітні U).

R Функції для цієї статистики (ті, про кого я знаю, все одно):

wilcox.test у стандартній установці R

середні стулки в пакеті кривошипів


3

На основі реферату Ця стаття може бути корисною для порівняння декількох змінних, що мають шкалу Лікерта. Він порівнює два типи непараметричних множинних тестів порівняння: один на основі рангів і один на основі тесту Чако. Він включає моделювання.


Наразі це майже схоже на коментар @PeterFlom. Хоча цифрова бібліотека ACM, ймовірно, менш чутлива до гниття посилань, ви б не хотіли сказати щось про статтю, можливо, точну інформацію корисної інформації, яку вона надає?
gung

2
Привіт @gung Я не був впевнений, де помістити коментар у цій довгій темі. Тут я додав цитування, оскільки питання, яке було опубліковано сьогодні, було закрито, і ця стаття здається корисною (і охоплює питання, яких я ще не бачив)
Peter Flom

2

Я зазвичай люблю використовувати сюжет Мозаїки. Ви можете створити їх, об'єднавши інші цікаві коваріати (наприклад, стать, стратифіковані фактори тощо).


2

Я погоджуюся з оцінкою Джеромі Англіма. Пам'ятайте, що відповіді Лікерта - це оцінки - ви не використовуєте абсолютно надійну лінійку для вимірювання фізичного об'єкта зі стабільними розмірами. Середнє значення є потужним заходом при використанні розумних розмірів вибірки.

У науково-дослідній діяльності та розробці продуктів середнє значення є на сьогодні найбільш поширеною статистикою для шкал Лікерта. Під час використання ваг Likert я зазвичай обирав міру, яка ідеально відповідає дослідницькому питанню. Наприклад, якщо ви говорите про "уподобання" або "ставлення", ви можете використовувати кілька індикаторів, заснованих на Лікерті, при цьому кожен показник дає дещо іншу інформацію.

iХ


1

"Оцінка балів" часто використовується для узагальнення порядкових даних, особливо якщо мова йде про змістовні словесні якоря. Іншими словами, ви можете повідомити про "топ-2", відсоток, який вибрав або "погодитися", або "повністю згоден".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.