Припустимо таку ситуацію:
ми маємо велику кількість (наприклад, 20) з невеликими розмірами групи (наприклад, n = 3). Я помітив, що якщо я генерую значення з рівномірного розподілу, залишки будуть виглядати приблизно нормально, навіть якщо розподіл помилок є рівномірним. Наступний код R демонструє таку поведінку:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
Якщо я подивимось на залишок вибірки у групі з трьох, причина поведінки зрозуміла:
Оскільки - це сума випадкових величин з не приблизно різним стандартним відхиленням, то його розподіл трохи ближче до нормального розподілу, ніж окремі умови.
Тепер припустимо, що у мене така ж ситуація і з реальними даними, а не з імітованими даними. Я хочу оцінити, чи є припущення ANOVA щодо нормальності. Більшість рекомендованих процедур рекомендують візуальний огляд залишків (наприклад, QQ-Plot) або тест на нормальність залишків. Як мій приклад вище, це не дуже оптимально для невеликих розмірів групи.
Чи є краща альтернатива, коли у мене багато груп невеликих розмірів?