Як візуалізувати незалежний два зразки t-тесту?


11

Які найприйнятніші способи візуалізації результатів незалежного двох вибіркових тестів? Чисельніша таблиця частіше використовується чи якийсь сюжет? Мета полягає у тому, щоб випадковий спостерігач подивився на фігуру і відразу побачив, що вони, ймовірно, з двох різних груп населення.


"Прийнято" ким, в якому контексті? "Частіше використовується" де?
Glen_b -Встановіть Моніку

Відповіді:


18

Варто чітко визначити мету вашого сюжету. Загалом, є два різних цілі: ви можете зробити сюжети для себе, щоб оцінити припущення, які ви робите, та керувати процесом аналізу даних, або ви можете зробити сюжети, щоб повідомляти результат іншим. Це не те саме; Наприклад, багато глядачів / читачів вашого сюжету / аналізу можуть бути статистично незафіксованими і можуть не бути знайомі з ідеєю, скажімо, про рівну дисперсію та її роль у t-тесті. Ви хочете, щоб ваш сюжет передав важливу інформацію про ваші дані навіть споживачам, як вони. Вони неявно довіряють, що ви все зробили правильно. З вашого питання про налаштування питань, я розумію, ви після останнього типу.

Реально, найпоширеніший і прийнятий сюжет для передачі результатів t-тесту 1 іншим (відміняйте, чи він насправді є найбільш підходящим) - це діаграму засобів із стандартними смужками помилок. Це дуже добре відповідає t-тесту, оскільки t-тест порівнює два засоби, використовуючи стандартні помилки. Якщо у вас є дві незалежні групи, це дасть інтуїтивну картину, навіть для статистично незафіксованих, і люди, які бажають отримати дані, можуть "негайно побачити, що вони, ймовірно, з двох різних груп населення". Ось простий приклад використання даних @ Тіма:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

введіть тут опис зображення

Однак, фахівці з візуалізації даних зазвичай нехтують цими сюжетами. Вони часто висміюються як "динамітні сюжети" (пор. Чому динамітні сюжети погані ). Зокрема, якщо у вас є лише кілька даних, часто рекомендується просто показати самі дані . Якщо точки перекриваються, ви можете потріскати їх по горизонталі (додайте невелику кількість випадкового шуму), щоб вони більше не перетиналися. Оскільки t-тест в основному стосується засобів та стандартних помилок, найкраще накладати засоби та стандартні помилки на такий сюжет. Ось інша версія:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

введіть тут опис зображення

Якщо у вас багато даних, боксерти можуть бути кращим вибором для швидкого огляду дистрибутивів, і ви також можете накласти на них засоби та SE.

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

введіть тут опис зображення

Прості сюжети даних та скриньки даних досить прості, що більшість людей зможе зрозуміти їх, навіть якщо вони не дуже статистично знають. Майте на увазі, що жодне з них не дозволяє легко оцінити обгрунтованість використання тесту для порівняння ваших груп. Ці цілі найкраще відповідають різним видам сюжетів.

1. Зауважте, що це обговорення передбачає незалежний зразок t-тесту. Ці сюжети можна використовувати із залежним t-тестом зразків, але в цьому контексті також можуть вводити в оману (пор., Чи неправильно використовувати рядки помилок для засобів у дослідженні в рамках суб'єктів? ).


Велика проблема використання графіку bar + CI полягає в тому, що іноді різниця є статистично значущою, але CI перетинаються . Зважаючи на те, що бар + CI сюжет намагається привабити загальну аудиторію, ми дійсно не хочемо витрачати час на пояснення цієї додаткової зморшки.
Гейзенберг

@Heisenberg, я знаю про це. Немає єдиного ідеального сюжету на всі випадки та цілі. Я також не згадав про КІ, лише про СЕ (хоча це було б еквівалентно деякому CI, залежно від df). Значення зазвичай згадується в підписі малюнка та обговорюється в тексті. Якщо ви хочете, щоб це відображалося однозначно в самому графіку, ви можете додати дужки та p-значення (наприклад, тут ).
gung - Відновіть Моніку

Вибачте, якщо тон звучить агресивно. Мені трохи приємно, що врешті-решт все ще немає елегантного способу візуалізувати тест для широкої аудиторії, не пояснюючи далі. Це може звестись до побудови графіку: 2 барних ділянки, що показують групові засоби з SE, і третій графік, що показує різницю та її CI (наприклад, ваше посилання ). Але така візуалізація показує надлишкову інформацію (групи означають І різницю в засобах), яка також може заплутати аудиторію.
Гейзенберг

@Heisenberg, я б не використовував сюжет з іншої відповіді, якщо б я не намагався показати тест для пацієнтів. Я думаю, що, мабуть, часто добре представити 2 бари з / п на тест, без простого підпису фігури. Якщо вам потрібна значущість у сюжеті, ви можете додати дужки або щось подібне (я взагалі вважаю це зайвим).
gung - Відновити Моніку

14

Найчастіше використовується спосіб візуалізації т-тестоподібне порівняння - це використання боксплотів . Нижче я навожу приклад з використанням набору даних, що описує "зв’язок між курінням марихуани та дефіцитом продуктивності у завданні, що вимірює короткочасну пам'ять" з цього сайту .

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

введіть тут опис зображення

На насправді, притаманне рефлективні , вербальні зазвичай використовуються для «неофіційного» гіпотези тестування, наприклад , як описано Йоав Бенджамін в 1988 році паперу Відкривши коробку з Boxplot :

Звичайний боксер доповнюється приблизним довірчим інтервалом для медіани партії, показаної у вигляді пари клинів, витягнутих з боків коробки. Ці інтервали довіри побудовані таким чином, що коли дві виїмки різної коробки не перетинаються, їх медіани значно відрізняються. (...) Оскільки формула довірчого інтервалу - це постійний час міжквартильного діапазону, поділеного на квадратний корінь розміру партії, остання може бути сприйнята з довжини клинів щодо довжини коробки.

Дивіться також: T-тест, використовуючи лише підсумкові дані у графічному графіку

Цей сюжет не відображає кількості, в яких безпосередньо бере участь т-тест, як помітив @NickCox . Якщо ви хочете безпосередньо порівняти засоби з довірчими інтервалами, ви можете скористатись графіком з позначеними довірчими інтервалами. Використання засобів та інтервалів довіри також дозволяє провести перевірку гіпотез (див. Тут або тут ).

введіть тут опис зображення

Як видно з інших публікацій та коментарів у цій темі, і боксплоти, і динамітні сюжети є дещо суперечливим вибором, тому дозвольте надати вам ще одну альтернативу, про яку ще не згадувалося. Спочатку згадаймо цет-тест та регрес пов'язані . Можна заговоритит-тестові порівняння як дві точки з панелями помилок (довірчі інтервали), пов'язані з лінією. Нахил лінії пропорційний нахилу регресії, якщо ви використовували лінійну регресію, а нет-тест у цій ситуації. Основна перевага такого сюжету полягає в тому, що він дозволяє легко судити про величину різниці засобів, дивлячись на нахил лінії. Недоліком може бути те, що він може припустити, що між засобами є певна «наступність» (тобто, що ви мали парні зразки).

введіть тут опис зображення

Схоже, частіше використовуються Boxplots, оскільки вони надають більше інформації про розподіл візуалізованих змінних (порівнюючи середнє значення лише з інтервалом довіри). Вони також доповнюють, а не дублюють інформаціют-тест та таке використання сюжету заохочується більшістю стильових посібників, наприклад, Посібником з публікацій Американської психологічної асоціації :

Перший розгляд - це інформаційне значення фігури в тексті статті, в якій вона має бути представлена. Якщо малюнок не додає суттєво до розуміння паперу або копіює інші елементи паперу, він не повинен включатися.


4
Це дійсно часто, навіть у текстах, які обговорюють t-тести та ANOVA, але все ж це надзвичайний вибір. На графічному графіку не відображається жодна з кількостей, залучених до t-тесту. Як мінімум, відповідний сюжет повинен показувати засоби та детальніше розповідати про розподіл, ніж це графічний графік. Деталі, що знаходяться в межах хвостів, часто мають вирішальне значення при тлумаченні тесту.
Нік Кокс

OK @NickCox, набір даних був обраний саме для візуалізації, але тепер я змінив його на більш відповідний приклад.
Тім

3
Штриховий сюжет (він же "динамітний сюжет") має надзвичайно високе співвідношення чорнило: інформація.
Френк Харрелл

Цитата з посібника APA (я не перевіряв контекст) є гарною загальною порадою, але сама по собі не є прямим аргументом для використання в цьому контексті частково відповідного сюжетного поля. Я погоджуюся, природно, що боксерки можуть бути дуже корисними і часто доповнюють один одного, і що вони дуже часто використовуються, але мій перший пункт залишається.
Нік Кокс

@NickCox Я не можу сказати, що я не згоден з вами, але я все-таки вважаю, що Boxplot надасть додаткову інформацію та не дублює результати t-тесту, навіть якщо це безпосередньо не стосується t-тесту. Це просто, зрозуміло та інформативно.
Тім

8

Це здебільшого варіація корисних відповідей @Tim та @gung, але графіки не можуть бути вписані в коментар.

Невеликі, але можливо корисні моменти:

  1. Діаграма смуги або крапка, як показано на @gung, потребує модифікації, якщо є зв'язки, як це є в даних прикладу. Окуляри можна складати або клацати, або як у наведеному нижче прикладі, ви можете використовувати гібридний графік із квантильною коробкою із як це запропонував Емануель Парзен (найдоступніший посилання - це, мабуть, 1979. Непараметричне статистичне моделювання даних). Журнал, Американська статистична асоціація74: 105-121). У цьому є і інші достоїнства, підкреслюючи, що якщо половина даних знаходиться у вікні, то половина теж зовні, і в тому, що показує фактично всю деталізацію розподілу. Там, де є лише дві групи, як це є в цьому контексті, будь-який більш звичайний вид сюжетної коробки може бути мінімальним, справді скелетним. Деякі вважають це чеснотою, але є можливість показати більше деталей. Зворотний аргумент полягає в тому, що графічний графік, що позначає конкретні точки, зокрема ті, що перевищують 1,5 IQR від ближчого кварталу, є чітким попередженням для користувача: стежте за допомогою тесту t, оскільки у хвостах можуть бути точки, які вам слід хвилюйся.

  2. Ви, природно, можете додати вказівку про засоби до коробкової ділянки, що досить часто робиться. Додавання іншого маркера чи символу точки є загальним явищем. Тут ми вибираємо опорні лінії.

введіть тут опис зображення

Квартирні коробки для курців та некурящих. У скриньках зображені медіани та квартилі. Горизонтальні лінії синього кольору означають.

Примітка. Графік створено в Stata. Ось код для зацікавлених. stripplotповинні бути встановлені раніше з ssc inst stripplot.

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

EDIT. Ця подальша ідея у відповідь на відповідь @Frank Harrell накладає два нормальних графіки ймовірності (дійсно квантильно-квантильні графіки). Горизонтальні лінії показують засоби. Деякі бажають додати рядки для кожної групи, що вказує на ідеальне прилягання, наприклад, через (0, його значення) та (1, це означає + його SD) або надійні альтернативи.

введіть тут опис зображення


1
+1, я мав на увазі стримувати дані, але мені ще не вдалося дійти до них. Я також думав над тим, щоб додати більш досконалі сюжети, включаючи сюжети з квантильною коробкою, сюжетні скрипки та qq-сюжети, але я врешті відмовився від ідеї перерахувати ще більше сюжетів.
gung - Відновіть Моніку

@gung Ярмарок досить; на жаль або на щастя, нитка може легко перетворитись на те, як порівняти два розподіли взагалі. Для іншого прикладу даних, гістограми можуть бути серйозним конкурентом тощо.
Нік Кокс

5

Окрім приємної мети представлення результатів, слід врахувати, яка графіка перевіряє припущення щодо двох зразків однакової дисперсіїт-тест, щоб він мав відмінні показники. Це були б нормальні зворотні функції двох емпіричних функцій кумулятивного розподілу. Для задоволення тестових припущень ці дві криві повинні бути паралельними прямими.


Я додав одну із різних можливостей до власної відповіді.
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.