У вас немає підстав стверджувати, що ваші дані є нормальними. Навіть якщо обидві перекоси та зайвий куртоз були рівно 0, це не означає, що ваші дані є нормальними. Хоча косоокість і куртоз далеко від очікуваних значень вказують на ненормальність, зворотне не дотримується. Існують ненормальні розподіли, які мають таку ж косисть і куртоз, як і нормальні. Приклад обговорюється тут , щільність якого наводиться нижче:
Як бачите, це виразно бімодальний. У цьому випадку розподіл є симетричним, тому до тих пір, поки існують достатні моменти, типова міра перекосу буде дорівнює 0 (справді всі звичайні заходи будуть). Що стосується куртозу, то вклад у четверті моменти з області, близької до середньої, буде, як правило, робити куртоз меншим, але хвіст є відносно важким, що, як правило, збільшує його. Якщо ви виберете правильно, куртоз виходить з тим же значенням, що і для звичайного.
Ваша косоокість зразка насправді становить близько -0,5, що говорить про м'яку косий зліва. Ваша гістограма та графік QQ вказують на одне і те ж - м'яко-лівий розподіл. (Таке м'яке перекос навряд чи буде проблемою для більшості звичайних нормально-теоретичних процедур.)
Ви дивитесь на кілька різних показників ненормативності, з якими не слід очікувати, що вони погоджуються апріорі , оскільки вони враховують різні аспекти розподілу; з невеликими, м'яко ненормальними зразками, вони часто не згодні.
Тепер для головного питання: * Чому ви тестуєте на нормальність? *
[відредаговано у відповіді на коментарі:]
Я не дуже впевнений, я хоч мав би перед тим, як робити ANOVA
Тут має бути зроблено ряд питань.
i. Нормальність - це припущення щодо ANOVA, якщо ви використовуєте його для висновку (наприклад, тестування гіпотез), але воно не особливо чутливе до ненормативності у більших зразках - легка ненормальність має незначні наслідки, оскільки розміри вибірки збільшують розподіл стають більш ненормальними, і тест може бути лише незначним чином.
ii. Ви, здається, перевіряєте нормальність відповіді (DV). Сам (безумовний) розподіл DV не вважається нормальним в ANOVA. Ви перевіряєте залишки, щоб оцінити обґрунтованість припущення про умовний розподіл (тобто його термін помилки в моделі, яка вважається нормальною) - тобто ви, здається, не дивитесь на правильну річ. Дійсно, оскільки перевірка робиться на залишки, ви робите це після встановлення моделі, а не раніше.
iii. Офіційне тестування може бути поряд з марним. Питання, яке тут цікавить, полягає в тому, «наскільки погано впливає ступінь ненормативності на мій висновок?», На що насправді тест гіпотези не відповідає. Зі збільшенням обсягу вибірки тест стає все більш здатним виявити тривіальні відмінності від нормальності, тоді як вплив на рівень значущості в ANOVA стає все меншим і меншим. Тобто, якщо розмір вибірки досить великий, тест на нормальність здебільшого говорить про те, що ви маєте великий розмір вибірки, що означає, що вам може не до чого турбуватися. Принаймні, з QQ сюжетом ви маєте візуальну оцінку того, наскільки це ненормально.
iv. при розумних розмірах вибірки інші припущення - як рівність дисперсійності та незалежності - як правило, мають значення набагато більше, ніж легка ненормальність. Спершу хвилюйтесь про інші припущення ... але знову ж таки, формальне тестування не відповідає правильному питанню
v. вибір, чи робити ви ANOVA чи якийсь інший тест на основі результату тесту гіпотези, має властивості гірші, ніж просто вирішити діяти так, як ніби припущення не відповідає. (Існує безліч методів, які підходять для одностороннього ANOVA-подібного аналізу даних, які не вважаються нормальними, і ви можете їх використовувати, коли не думаєте, що у вас є підстави вважати нормальність. Деякі мають дуже хороший потенціал як правило, і з гідним програмним забезпеченням немає підстав уникати їх.)
[Я вважаю, що я мав посилання на цю останню точку, але зараз не можу її знайти; якщо я знайду це, я спробую повернутися і вкласти його]