Візуалізація даних реакції на предмет Likert


25

Які хороші способи візуалізувати набір відповідей Лікерта?

Наприклад, набір предметів, які розпитують про важливість X для прийняття рішень щодо A, B, C, D, E, F & G? Чи є щось краще, ніж складені діаграми?

  • Що слід зробити з відповідями непридатних? Як вони можуть бути представлені?
  • Чи повинні звітні смуги відображати відсотки чи кількість відповідей? (тобто чи мають бруски загальної довжини?)
  • Якщо відсотки, чи повинен знаменник включати недійсні та / або N / A відповіді?

У мене є власні погляди, але я шукаю ідеї інших людей.

Відповіді:


30

Мені подобається зосереджений погляд на кількість. Ця конкретна версія видаляє нейтральні відповіді (ефективно трактуючи нейтральні та непридатні як однакові), щоб показати лише кількість думок, що згодні / не згодні. Точка 0 - це місце, де зустрічаються червоний і синій. Вісь відліку відсікається.

alt текст

Для порівняння, ось такі самі п’ять відповідей, як і складені відсотки, показуючи як нейтральну (сіру), так і без відповіді (білу).

alt текст

Оновлення: Документ, що пропонує аналогічний метод: Накреслення Likert та інших рейтингових шкал (PDF)


2
(+1) Цікаво! Яке програмне забезпечення ви використовуєте? Лише зауваження: Немає вказівки на абсолютні значення для% чи підрахунків, тому, здається, це дозволяє лише відносну інтерпретацію.
chl

Вибачте, я не прочитав ваше останнє речення (вісь x невидима). Спробую ще одне зауваження: Будь-який шанс отримати підрахунок НС видимим в зоні по центру (тобто відрізнити їх від нейтрального)?
chl

@chl Дякую Я використовую JMP, над яким отримую зарплату. Перший - це складена діаграма з позитивними та негативними значеннями, що має бути можливим у багатьох інструментах. Підрахунок НС можна проводити різними способами (на одному кінці, розділити на обидва кінці, посередині, окремий стовпчик), і жоден не здається кращим для більшості ситуацій.
xan

2
Просто хотілося додати для Rкористувачів, що подібні сюжети реалізовані в пакеті HH. Щоб створити враження, ви можете спробувати likert(t(apply(data, 2, table))).
hplieninger

1
Я думаю, що посилання "B Robbins, Naomi; M Heiberger, Richard (2011)." Складання графіків Лікерта та інших рейтингових шкал ". JSM 2011: 1058–1066."
Кіт Джонсон

23

Складені барчарти, як правило, добре розуміються нестатистами, за умови їх обережного введення. Корисно масштабувати їх за загальною метрикою (наприклад, 0-100%) з поступовим кольором для кожної категорії, якщо вони є порядковим пунктом (наприклад, Likert). Я віддаю перевагу крапковій схемі (точці Клівленда), коли не надто багато предметів і не більше 3-5 категорій відповідей. Але це справді питання наочної чіткості. Я, як правило, надаю%, оскільки це стандартизована міра, і я звітую лише про% і рахується з нескладеною діаграмою. Ось приклад того, що я маю на увазі:

data(Environment, package="ltm")
Environment[sample(1:nrow(Environment), 10),1] <- NA
na.count <- apply(Environment, 2, function(x) sum(is.na(x)))
tab <- apply(Environment, 2, table)/
       apply(apply(Environment, 2, table), 2, sum)*100
dotchart(tab, xlim=c(0,100), xlab="Frequency (%)", 
         sub=paste("N", nrow(Environment), sep="="))
text(100, c(2,7,12,17,22,27), rev(na.count), cex=.8)
mtext("# NA", side=3, line=0, at=100, cex=.8)

alt текст

Краще надання може бути досягнуто за допомогою latticeабо ggplot2. Всі пункти мають однакові категорії відповідей у ​​цьому конкретному прикладі, але в більш загальному випадку ми можемо очікувати різних, так що показ усіх них не здасться зайвим, як це відбувається у нас. Однак можна було б надати однаковий колір кожній категорії відповідей, щоб полегшити читання.

Але я б сказав, що складені діаграми краще, коли всі елементи мають однакову категорію відповідей, оскільки вони допомагають оцінити частоту однієї модальності відповідей у ​​елементах:

alt текст

Я також можу придумати якусь теплову карту, що корисно, якщо є багато предметів із подібною категорією відповідей. alt текст

Про відсутні відповіді (особливо, коли вони несуттєві або локалізовані на конкретному предметі / питанні) слід повідомляти, в ідеалі для кожного пункту. Як правило,% відповідей для кожної категорії обчислюються без NA. Це те, що зазвичай робиться при опитуванні або психометрії (ми говоримо про «виражені або спостережувані відповіді»).

PS Я можу придумати більш химерні речі, як, наприклад, малюнок, показаний нижче (перший зроблений вручну, другий з ggplot2, ggfluctuation(as.table(tab))), але я не думаю, що він передає таку точну інформацію, як точкова планка чи діаграма, оскільки зміни поверхні важко цінувати. alt текст

alt текст


2
До речі, питання про масштабних відповідях Graphing Лайкерта просто наткнувся на блог Ендрю Гельман вчора :) j.mp/aBm8mZ
хла

14

Я думаю, що відповідь Хла чудова.

Одне, що я можу додати, - це випадок, коли ви хочете порівняти співвідношення між елементами. Для цього ви можете використовувати щось на зразок матриці розсіювання графіків кореляції для упорядковано-категоричних даних

alt текст

(Цей код все ще потребує певного налаштування - але він дає загальну думку ...)


3
(+1) Це нагадує мені pairs.panelsфункцію в psychпакеті від W Revelle.
chl

Цікаво. Я зіткнувся з цим кодом, але ніколи не знав, що він також існує в психічному пакеті. Я впевнений, що це мене надихнуло якось, коли я написав цю публікацію (я повинен додати це до кредитів на пошті ...)
Тал Галілі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.