ANOVA: тестування припущення щодо нормальності для багатьох груп з кількома зразками на групу


12

Припустимо таку ситуацію:

ми маємо велику кількість (наприклад, 20) з невеликими розмірами групи (наприклад, n = 3). Я помітив, що якщо я генерую значення з рівномірного розподілу, залишки будуть виглядати приблизно нормально, навіть якщо розподіл помилок є рівномірним. Наступний код R демонструє таку поведінку:

n.group = 200
n.per.group = 3

x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)

Якщо я подивимось на залишок вибірки у групі з трьох, причина поведінки зрозуміла:

r1=x1mean(x1,x2,x3)=x1x1+x2+x33=23x1x2x3.

введіть тут опис зображення

Оскільки - це сума випадкових величин з не приблизно різним стандартним відхиленням, то його розподіл трохи ближче до нормального розподілу, ніж окремі умови.r1

Тепер припустимо, що у мене така ж ситуація і з реальними даними, а не з імітованими даними. Я хочу оцінити, чи є припущення ANOVA щодо нормальності. Більшість рекомендованих процедур рекомендують візуальний огляд залишків (наприклад, QQ-Plot) або тест на нормальність залишків. Як мій приклад вище, це не дуже оптимально для невеликих розмірів групи.

Чи є краща альтернатива, коли у мене багато груп невеликих розмірів?


1
З кількох причин, здається, це не проблема. По-перше, ваші залишки будуть здаватися рівномірними: подивіться на гістограму для величезної кількості груп, щоб побачити це. По-друге, нормальність залишків мало важлива для більшості аналізів; Що важливо, це приблизна нормальність розподілу вибірки. Який особливий аспект вашої заявки змушує вас припустити, що існує якась реальна проблема?
whuber

1
а) мої залишки не будуть виглядати рівномірними. Я перевірив це для кількох груп (не зразків на групу) від 20 до 20000. Я додав приклад до питання; це виглядає як щось середнє між рівномірним і нормальним, з чіткою тенденцією до нормальної. б) Я знаю, що мова йде про приблизну нормальність розподілу вибірки. Це вся суть питання, оскільки залишки будуть виглядати нормально, але розподіл вибірки - ні. Тому я не можу використовувати залишки для тестування властивостей розподілу вибірки.
Ерік

2
Це правильно. Але ви насправді зацікавлені в розподілі помилок чи вам цікаво виконати ANOVA? (Я не намагаюся сказати, що питання слід ігнорувати - це захоплююче питання, яке ви порушили, - але мені цікаво лише, чи справді вам потрібна відповідь, щоб продовжити аналіз даних.)
whuber

3
Але ви можете використовувати ті самі симуляції, щоб дослідити надійність системи ANOVA у вашому випадку!
kjetil b halvorsen

4
Одне злегка дотичне, але відповідне зауваження: загалом, використання тесту на нормальність (або припущення іншої моделі) перед тим, як зробити тест на гіпотезу, представляє (принаймні) три проблеми: 1) якщо ви це зробите, вам потрібно врахувати багаторазове тестування; 2) Відхилення альтернативної гіпотези, наприклад, "не нормально" не означає, що ви можете зробити висновок про нормальність; 3) Тести на припущення щодо моделей мають свої припущення щодо моделей, тож де ви зупиняєтесь?
Марта

Відповіді:


1

Робота над цією відповіддю виконана не повністю. Я маю деяке розуміння цього, але це потребує певного часу, щоб пояснити. Для цього розглянемо, що стандартне відхилення є упередженим для невеликих чисел. Причиною цього є те, що якщо ми візьмемо будь-які два числа , ми умовно призначимо, що вибіркове середнє значення буде , де середнє значення сукупності , цілком може бути де-небудь на інтервал між або може бути, що або . Це означає, що в середньому . Таким чином, тільки коли , що це зміщення стає малимa<ba+b2σ(a,b)σ<aσ>bSD<σn>100. Для довгої серії SD для невеликої кількості зразків кожен, розрахунок SD стає більш точним і більш очевидно неточним.

Тепер, замість того, щоб розчарувати руки в розчаруванні, ми можемо застосувати виправлення невеликого числа для наших SD в звичайних умовах. (Га! Є рішення нашої бідності.)

SD(n)μ(n)=2n1Γ(n2)Γ(n12)=114n732n219128n3+O(n4) див.E[μ]

Для це . Що означає, що ми повинні ділити наш SD на стільки, щоб оцінити .Γ ( 3n=3σΓ(32)=π20.8862269255σ

Тепер у випадку, коли ви представляєте, у вас є ще кілька речей. Як це буває, найкращим показником розташування рівномірного розподілу є не середина. Незважаючи на те, що середнє значення вибірки та медіана вибірки є неупередженими оцінками середньої точки, вони не є настільки ефективними, як середній діапазон вибірки, тобто середнє арифметичне вибірковий максимум та мінімум вибірки, що є об'єктивним оцінкою мінімальної дисперсії UMVU оцінка середини (а також максимальна оцінка ймовірності).

Тепер до м’яса справи. Якщо ви будете використовувати середнє значення крайніх значень, дисперсія міри розташування буде меншою, за умови, що ваші дані розподіляться по-справжньому рівномірно. Він може бути нормально розподілений, тому що один хвіст крайнього значення цілком може бути нормальним. Однак лише для 3-х зразків стандартне відхилення потребує корекції.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.