Як і інші параметричні тести, аналіз дисперсії передбачає, що дані відповідають нормальному розподілу. Якщо ваша змінна величина зазвичай не розподіляється, можливо, ви збільшуєте шанс на помилковий позитивний результат, якщо аналізувати дані за допомогою анова або іншого тесту, який передбачає нормальність. На щастя, анова не дуже чутлива до помірних відхилень від нормальності; симуляційні дослідження, використовуючи різноманітні ненормальні розподіли, показали, що помилково позитивна швидкість не сильно впливає на це порушення припущення (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Це тому, що коли ви берете велику кількість випадкових вибірок з популяції, засоби цих вибірок приблизно нормально розподіляються, навіть коли популяція не є нормальною.
Можна перевірити придатність набору даних для нормального розподілу. Я не пропоную вам це робити, оскільки багато наборів даних, які є суттєво ненормальними, були б цілком доречними для анова.
Натомість, якщо у вас досить великий набір даних, я пропоную вам просто переглянути гістограму частоти. Якщо це виглядає більш-менш нормально, продовжуйте виконувати анову. Якщо це виглядає як звичайний розподіл, який був висунутий в одну сторону, як сульфатні дані вище, ви повинні спробувати різні перетворення даних і побачити, чи якась із них робить гістограму більш нормальною. Якщо це не працює, а дані все ще виглядають сильно ненормальними, можливо, все одно добре аналізувати дані за допомогою anova. Однак ви можете проаналізувати його за допомогою непараметричного тесту. Практично кожен параметричний статистичний тест має непараметричний замінник, такий як тест Крускала – Уолліса замість одностороннього анова, тест Вілкоксона з підписом ранжу замість парного тесту та кореляція рангів Спірмена замість лінійної регресії. Ці непараметричні тести не припускають, що дані відповідають нормальному розподілу. Вони припускають, що дані в різних групах мають однаковий розподіл, як один у одного; якщо різні групи мають різну форму розподілу (наприклад, одна перекошена вліво, інша - перекошена вправо), непараметричний тест може бути не кращим, ніж параметричний.
Список літератури
- Скло, Г. В., П. П. Пекхем та Дж. Р. Сандерс. 1972. Наслідки невиконання припущень, що лежать в основі аналізу фіксованих ефектів дисперсії та коваріації. Преподобний Навч. Рез. 42: 237-288.
- Harwell, MR, EN Рубінштейн, WS Hayes та CC Olds. 1992. Узагальнення результатів Монте-Карло в методологічних дослідженнях: одно- та двофакторні фіксовані ефекти випадків ANOVA J. Educ. Стат. 17: 315-339.
- Lix, LM, JC Keselman та HJ Keselman. 1996. Насліджено наслідки порушень припущення: кількісний огляд альтернатив односторонньому аналізу тесту на дисперсію F. Преподобний Навч. Рез. 66: 579-619.