Як найкраще графічно відобразити помилку, потужність та розмір вибірки графічно типу II (бета)?


16

Мене просять написати вступ до статистики, і я намагаюся, як графічно показати спосіб співвідношення p-значення та потужності. Я придумав цей графік:

Дві криві Гаусса взаємодіють

Моє запитання: чи є кращий спосіб відображення цього?

Ось мій R-код

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Оновлення


Дякую за приголомшливі відповіді. Я змінив частину коду:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

Мені подобається пунктирна, трохи розпливчаста картина нульової гіпотези, оскільки це сигналізує про те, що її насправді немає. Я думав про прозорість та додавання альфа, але я переживаю за те, щоб отримати занадто багато інформації в одну картину, і тому вирішив не робити.

введіть тут опис зображення

Обмеження друкованих статей не дозволяє мені дозволити читачам експериментувати. Я вибрав відповідь @Greg Snow із TeachingDemos як свою відповідь, оскільки мені подобається, що дві помилки не перетинаються.


4
Ви можете трохи покращити графік, використовуючи псевдопрозорість. Щось на зразок цієї відповіді .
каракал

@caracal (+1) Мені слід додати зухвалий зразок (як ви) для області, що демонструє потужність.
chl

Це приємно, я бачив подібні сюжети деінде. Але це не відображає фактичних значень кількох p значень та потужності при цих p значеннях. Ви можете обчислити потужність для різних значень p та розмірів вибірки, а потім покласти кілька рядків на один графік
Пітер Флом - Відновити Моніку

1
Можливо, перевірити, як типи сюжетів генерує програмне забезпечення G * Power 3, було б корисно для уявлень про те, що планувати. Хоча з пам’яті вони здаються дуже схожими на те, що chl та каракал вже представлені (і не допоможуть тобі як це зробити в R).
Andy W

@Andy G * Діаграми на основі потужності та розміру ефекту або потужність проти альфа-сюжетів справді будуть приємним доповненням. Для першого випадку початком може стати ця відповідь , яка повинна легко адаптуватися до другого випадку.
каракал

Відповіді:


9

Я розігрувався з подібними сюжетами і виявив, що він працює краще, коли 2 криві не блокують одна одну, а є вертикально зміщеними (але все одно на одній осі x). Це дає зрозуміти, що одна з кривих представляє нульову гіпотезу, а інша представляє задане значення для середнього в альтернативній гіпотезі. power.exampФункція в пакеті TeachingDemos для R буде створювати ці ділянки і тому run.power.exampфункція ( той же пакет) дозволяє інтерактивно змінювати аргументи і оновити сюжет.


+1, більш повна ілюстрація, ніж моя. (Насправді я знав, що є щось у TeachingDemosпакунку, але був занадто лінивий, щоб його шукати.)
chl

14

Кілька думок: (а) Використовуйте прозорість та (б) Дозвольте деяку інтерактивність.

Ось мій прийом, в значній мірі натхненний аплетом Java на помилки типу I та II типу - помилки в системі правосуддя . Оскільки це досить чистий код для малювання, я вставив його як суть # 1139310 .

Ось як це виглядає:

введіть тут опис зображення

Н0


Це справді приголомшливо, я ніколи раніше не бачив аплпака.
Кен Вільямс

1
@Ken Спасибі aplpackПакет також має деякі хороші доповнення для а саме даних. Однак, rpanel , який також покладається на tcl / tk, є, мабуть, кращим варіантом для більш складних речей. Тепер, з RStudio та пакетом маніпулювання , також легко покращити базовий сюжет у R.
chl

8

G Power 3 , безкоштовне програмне забезпечення, доступне на Mac та Windows, має дуже приємні функції графіки для аналізу потужності. Основний графік в основному відповідає вашому графіку та графіку, показаному @chl. Він використовує просту пряму лінію, щоб вказати на нульову гіпотезу та альтернативну гіпотезу, перевірити статистичні розподіли, а кольори в бета-та альфа-роздільних кольорах.

Приємною особливістю G Power 3 є те, що він підтримує велику кількість загальних сценаріїв аналізу енергії, а графічний інтерфейс спрощує дослідження студентів та прикладних дослідників.

Ось знімок екрана слайда (узятий із презентації, яку я дав на описовій статистиці з розділом про аналіз потужності ) з кількома такими графіками, показаними зліва. Якщо ви вибрали версію t-test з одним хвостом, це буде більше схоже на ваш приклад.

г потужність 3 графіка

Також можливо створити графіки, які показують функціональний зв'язок між факторами, що стосуються статистичної потужності та тестування гіпотез (наприклад, альфа, розмір ефекту, розмір вибірки, потужність тощо). Я представляю кілька прикладів таких графіків тут . Ось один приклад такого графіка:

введіть тут опис зображення


Цікавий пакет, я розглядаю його в майбутньому. Графіки здаються трохи складними, хоча для когось нового у цій галузі. Моя аудиторія є докторантами без будь-яких математичних чи статистичних знань. Спасибі!
Макс Гордон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.