У мене є деякі дані, які виглядають із побудови графіка залишків проти часу майже нормальним, але я хочу бути впевненим. Як я можу перевірити нормальність залишків помилок?
У мене є деякі дані, які виглядають із побудови графіка залишків проти часу майже нормальним, але я хочу бути впевненим. Як я можу перевірити нормальність залишків помилок?
Відповіді:
Жоден тест не скаже, що ваші залишки зазвичай розподіляються. Насправді ви можете надійно зробити ставку, що їх немає .
Перевірки гіпотез зазвичай не є гарною ідеєю, оскільки перевірка ваших припущень. Ефект ненормальності на ваших умовиводах зазвичай не залежить від розміру вибірки *, але результат тесту значущості є . Невелике відхилення від нормальності буде очевидним при великому розмірі вибірки, навіть якщо відповідь на питання про фактичний інтерес ("якою мірою це вплинуло на моє висновок?") Може бути "навряд чи взагалі". Відповідно, велике відхилення від нормальності при невеликому розмірі вибірки може не наближатися до значущості.
* (додано в редагуванні) - насправді це занадто слабке твердження. Вплив ненормальності насправді зменшується з розміром вибірки в будь-який час, коли ця теорема CLT та Слуцького буде дотримана, тоді як здатність відкидати нормальність (і, мабуть, уникати нормально-теоретичних процедур) збільшується з розміром вибірки ... так просто коли ви найбільш здатні ідентифікувати ненормальність , як правило, коли він не має значення , † в будь-якому випадку ... і тест не допоможе , коли він на самому справі має значення, в невеликих зразках.
добре, принаймні, на рівень значущості. Потужність все ще може бути проблемою, хоча якщо ми розглянемо великі зразки, як тут, це може бути менше питання.
Що наближається до вимірювання розміру ефекту - це деяка діагностика (або дисплей, або статистика), яка певним чином вимірює ступінь ненормативності. Діаграма QQ є очевидним відображенням, а графік QQ з однієї сукупності при одному розмірі вибірки та різному розмірі вибірки є щонайменше обома галасливими оцінками однієї кривої - показуючи приблизно однакову «ненормальність»; вона повинна, принаймні, приблизно бути монотонно пов'язаною з бажаною відповіддю на питання, що цікавить.
Якщо вам потрібно скористатися тестом, Шапіро-Вілк, мабуть, приблизно такий же хороший, як і все інше (тест Чен-Шапіро, як правило, трохи кращий за альтернативами, що представляють спільний інтерес, але складніше знайти варіанти реалізації) - але це відповідь на питання, яке ви вже знаю відповідь на; кожного разу, коли ви не відмовляєтесь, це дає відповідь, ви можете бути впевнені, що це неправильно.
Тест Шапіро-Вілка - одна з можливостей.
Цей тест реалізований майже у всіх статистичних пакетах програм. Нульова гіпотеза - залишки звичайно розподіляються, тому невелике p-значення вказує на те, що слід відхилити нуль і зробити висновок, що залишки зазвичай не розподіляються.
Зауважте, що якщо розмір вибірки великий, ви майже завжди будете відхилятись, тому більш важливою є візуалізація залишків.
З Вікіпедії:
Тести універсальної нормальності включають тест К-квадрата Д'Агостіно, тест Жарк-Бера, тест Андерсона-Дарлінга, критерій Крамера – фон Мізеса, тест Лілліфорса на нормальність (сам адаптація тесту Колмогорова – Смірнова), Тест Шапіро – Вілк, тест Хі-квадрат Пірсона і тест Шапіро – Франція. Доклад у журналі "Журнал статистичного моделювання та аналітики" [1] приходить до висновку, що Шапіро-Вілк має найкращу силу для даної значущості, за якою уважно слідкує Андерсон-Дарлінг при порівнянні Шапіро-Вілка, Колмогорова-Смірнова, Лілліфорса та Андерсона- Тести для коханих.