Як відобразити смуги помилок для перехресних (парних) експериментів


19

Наступний сценарій став найбільш поширеним запитанням у трійці слідчого (I), рецензента / редактора (R, не пов’язаного з CRAN) і мене (M) як творця сюжету. Можна припустити, що (R) - типовий медичний рецензент великого начальника, який знає лише, що кожен сюжет повинен мати панель помилок, інакше це неправильно. Якщо бере участь статистичний рецензент, проблеми є набагато менш критичними.

Сценарій

У типовому фармакологічному перехресному дослідженні перевіряють два препарати А та В на їх вплив на рівень глюкози. Кожного пацієнта проводять тестування двічі у випадковому порядку та при допущенні відсутності перенесення. Основна кінцева точка - різниця між глюкозою (BA), і ми вважаємо, що парний t-тест є адекватним.

(I) хоче графік, який показує абсолютний рівень глюкози в обох випадках. Він побоюється бажання (R) барів помилок і просить стандартних помилок у гістограмах. Давайте не розпочинаємо тут війн-графік ._)

гістограми та глюкоза SE для двох процедур

(I): Це не може бути правдою. Прутки перекриваються, і у нас p = 0,03? Це не те, що я навчився у середній школі.

(М): У нас тут парний дизайн. Запрошені смужки помилок абсолютно не мають значення. Що враховує SE / CI парних відмінностей, які не показані на графіку. Якби у мене був вибір, а даних було не надто багато, я вважаю за краще наступний сюжет

З'єднані лінії показують спарювання, крапки початкових значень

Додано 1: Це паралельний графік координат, згаданий у кількох відповідях

(M): Рядки показують спарювання, і більшість ліній йде вгору, і це правильне враження, адже нахил - це те, що рахується (нормально, це категорично, але все-таки).

(Я): Ця картина заплутана. Ніхто цього не розуміє, і в ньому немає смужок помилок (R ховається).

(M): Ми також можемо додати ще один сюжет, який показує відповідний довірчий інтервал різниці. Відстань від нульової лінії створює враження розміру ефекту.

(Я): Ніхто цього не робить

(R): І вона марнує дорогоцінні дерева

(М): (Як хороший німець): Так, точка на деревах береться. Але я все-таки використовую це (і ніколи не публікую його), коли у нас є багаторазове лікування та кілька контрастів.

довірчий інтервал різниці

Будь-які пропозиції ? R-код знаходиться нижче, якщо ви хочете створити сюжет.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

О боже мій @ dieter-menne, велике запитання! Це так залежить від типу журналу, до якого ви подаєте статтю. Я буду триматися подалі від графічних воєн, але я люблю графіки 2 і 3: стільки інформації за так мало місця.
подв. Номерів

4
Массон і Лоффус (2003) - часто дана посилання. Вони показують приклади графіків, в яких вони панелі CI різниці на другій панелі того ж графіка. Чи стане це щасливим для всіх, хто перебуває в цирку, я не знаю (хоча я відчуваю за тебе!)
Енді Ш

Дякую, @AndyW, за довідку. Це до речі, але є проблема: це з психології. Існує набагато більше хороших статей на цю тему від психологів, які мають набагато кращий статистичний досвід порівняно з медичними рецензентами. Я б хотів, щоб я міг знайти якийсь посібник з високого рейтингу журналу на цю тему, це єдиний гострий меч, з яким я міг би впоратися.
Дітер Менне

Відповіді:


17

Ви абсолютно правильні у своєму припущенні, що смужки помилок, що представляють стандартну середню помилку, абсолютно не підходять для внутрішніх проектів. Однак питання про перекриття смуг помилок та їх значення є ще однією темою, до якої я повернуся наприкінці цього коментованого списку довідок.

Існує багата література з Психології про довірчі інтервали довіри або смуги помилок, які роблять саме те, що ви хочете. Довідкова робота чітко:

Loftus, GR, & Masson, MEJ (1994). Використання довірчих інтервалів у внутрішніх темах . Психономічний вісник та огляд , 1 (4), 476–490. doi: 10.3758 / BF03210951

Однак їхня проблема полягає в тому, що вони використовують один і той же термін помилки для всіх рівнів внутрішнього предмета. Це, здається, не є величезною проблемою для вашої справи (2 рівня). Але є більш сучасні підходи до вирішення цієї проблеми. Дуже помітно:

Франц, В. і Лоффус, Г. (2012). Стандартні помилки та інтервали довіри у внутрішніх темах: Узагальнення Лоффуса та Массона (1994) та уникнення упередженості альтернативних рахунків . Психономічний вісник та огляд , 1–10. doi: 10.3758 / s13423-012-0230-1

Багулей, Т. (2011). Обчислення та графік інтервалів довірчих інтервалів для ANOVA. Методи дослідження поведінки . doi: 10.3758 / s13428-011-0123-7 [ можна знайти тут ]

Подальші посилання можна знайти в двох останніх роботах (які, на мою думку, варто прочитати).


Як дослідники інтерпретують КІ? Погано згідно з наступним документом:

Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). Дослідники неправильно розуміють інтервали довіри та стандартні рядки помилок . Психологічні методи , 10 (4), 389–396. doi: 10.1037 / 1082-989X.10.4.389

Як слід інтерпретувати CI, що перекриваються та не перекриваються?

Куммінг, Г., Фінч, С. (2005). Висновок очей: Інтервали довіри та способи читання зображень даних . Американський психолог , 60 (2), 170–180. doi: 10.1037 / 0003-066X.60.2.170


Остання заключна думка (хоча це не стосується вашого випадку): Якщо у вас в одному сюжеті розроблений роздільний сюжет (тобто фактори між і між предметами), ви можете забути про смуги помилок разом. Я б (смиренно) рекомендувати свою raw.means.plotфункцію в пакеті R plotrix.


2
Дуже корисний довідковий список. Куммінг об'єднав багато своїх ідей в amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/… (що ви хочете сказати про вираз "нова статистика", я, мабуть, згоден.)
Нік Кокс


@amoeba Баґлейський документ, який я цитую, використовує техніку паперу Морі.
Генрік

10

Питання, здається, не так про смужки помилок, як про найкращі способи побудови парних даних.

По суті, рядки помилок тут є максимум способом узагальнення невизначеності: вони не мають, і вони обов'язково не можуть сказати багато про будь-яку тонку структуру в даних.

Паралельні координатні сюжети - іноді називаються графіками профілю, терміном, який означає різні речі в різних областях - були згадані у питанні. Основні сюжетні схеми вже запропонували @Ray Koopman.

AB(A+B)/2A+B

Іншим джерелом цього сюжету є Нейман, Дж., Скотт, Е. Л. та Шейн, CD 1953. Про просторовий розподіл галактик: конкретна модель. Астрофізичний журнал 117: 92–133.

В широкому розумінні такі сюжети нагадують ідею побудови залишків проти пристосованих, також популяризованих Тукеєм та його зятям у квадраті Anscombe.

AB=0A=BAB

Занедбаний дизайн - це паралельно-лінійний графік McNeil, DR 1992. Про графічні парні дані. Американський статистик 46: 307–310. Про це також йдеться в двох посиланнях нижче.

Огляди, пов’язані з статистикою, містять декілька посилань

2004 р., Графічна угода та незгода. Статистичний журнал 4: 329-349.

.pdf доступний за адресою http://www.stata-journal.com/sjpdf.html?articlenum=gr0005

Парні, паралельні або профільні графіки для змін, кореляцій та інших порівнянь. Статистичний журнал 9: 621-639.

.pdf доступний за адресою http://www.stata-journal.com/sjpdf.html?articlenum=gr0041

Користувачі, які не мають статистичних даних, повинні пропустити та пропустити свій код через код Stata, розробляючи, як реалізувати графіки у власному улюбленому програмному забезпеченні.

AB


4

Спробуйте розкидати сюжет окремих точок (A, B). Більшість із них повинна лежати лише на одній стороні діагоналі (лінія А = В). Є два аналоги смужок помилок. Умовна, еквівалентна CI для середньої різниці, буде довірчою смугою для середньої різниці. Діапазон був би областю між двома прямими, обидві з яких паралельні діагоналі. Парний t-тест був би суттєвим, якщо і лише тоді, коли обидва краї смуги знаходяться на одній стороні діагоналі.

Більш консервативним аналогом смужок помилок був би еліпс довіри для центроїда.


1
cmethodBcmethodA

Ні, кл. - :) Клінічна хімія надто складна. Можливо, ви додали якусь посилання в "там"; Я не впевнений, про який папір ви говорите.
Дітер Менне

4

Попередній підсумок:

Массон / Лоффус - це дуже вичерпне, і непросте читання, щоб дати моїм колегам-медикам, які не прийняли б щось на кшталт "взаємодії". Вони також мають кілька пропозицій щодо кількох порівнянь, які показують, що парні інтервали довіри важко проілюструвати, коли не хочеться сильно спрощувати.

Массон Лофтус

Мені не подобається цей стиль: бари з смужками помилок виглядають минулим тисячоліттям Видатно. Однак вони також використовують трохи більш елегантний стиль:

Массон Лоффус без брусків

Куммінг / Фінч та Белія та ін. читання повинні бути. Перший - ідеальний вибір, щоб дати своєму другові, який здригається, коли він бачить взаємодію слова . Я замовив книгу Каммінга, прочитавши цю статтю. Другий показує тест, який я проведу в Блискучих до наступної зустрічі медичного слідчого.

Куммінг / Фінч

Мені подобається цей сюжет, навіть якщо є друга вісь, яку я ніколи раніше не використовував; перевірити внесок Генріка та деяких інших в StackOverflow для графічного методу на базі R, щоб отримати його. Я вважаю за краще поставити другу вісь зліва від різниці, щоб зробити абсолютно зрозумілим, що значення змінилися, і, можливо, додати вісь p-значення.

Хтось із решітки / ggplot фракції знімав? Усі рішення, що постачаються, є базовою графікою і не піддаються панелі / граніці.

Однак: зауважте, що коментарі та роботи здебільшого з відділу психології (і @cbeleites з хардкор-хімії). Було б добре отримати коментарі від рецензентів медичних журналів.


0

Чому б не просто побудувати різницю * для кожного пацієнта? Потім ви можете використовувати гістограму, графік поля або звичайний графік ймовірності та накладати 95% довірчий інтервал для різниці.

  • У деяких сценаріях це може бути різниця логарифмів. Див., Наприклад, Patterson & Jones, "Біоеквівалентність та статистика в клінічній фармакології", Чапман, 2006.

Чому ні? Це може надати достовірну інформацію, але сюжети з окремими точками або парами не дуже популярні в медичних дослідженнях. Ось чому паралельний сюжет (який надає більше інформації) настільки непопулярний. Медичні дослідники хочуть, щоб середні значення та «нормальний діапазон» (що б там не було).
Дітер Менне
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.