Чому F-тест настільки чутливий для припущення про нормальність?


16

Чому F -тест різниці дисперсій настільки чутливий до припущення про нормальний розподіл навіть для великих N ?

Я спробував здійснити пошук в Інтернеті та відвідав бібліотеку, але жодна з них не дала хороших відповідей. Там сказано, що тест дуже чутливий до порушення припущення про нормальний розподіл, але я не розумію, чому. Хтось має гарну відповідь на це?


6
Який -testF вас цікавить?
Стефан Коласа

F-тест для вимірювання різниці дисперсій.
Магнус Йоганнесен

Відповіді:


35

Я припускаю, що ви маєте на увазі тест F на співвідношення дисперсій при тестуванні пари варіацій вибірки на рівність (адже це найпростіший, досить чутливий до нормальності; F-тест на ANOVA менш чутливий)

Якщо ваші зразки взяті з звичайних розподілів, дисперсія вибірки має масштабований розподіл квадратних чі

Уявіть, що замість даних, отриманих із звичайних дистрибутивів, у вас був розподіл, який був більш важким, ніж звичайний. Тоді ви отримаєте занадто багато великих дисперсій відносно розподіленого чи-квадратного розподілу, і ймовірність того, що вибіркова дисперсія потрапить у крайній правий хвіст, дуже чутливо реагує на хвости розподілу, з яких отримані дані =. (Буде також занадто багато невеликих дисперсій, але ефект трохи менш виражений)

Тепер, якщо обидва зразки витягнуті з цього більш важкого хвостового розподілу, більший хвіст на чисельнику призведе до перевищення великих значень F, а більший хвіст на знаменнику створить надлишок малих значень F (і навпаки для лівого хвоста)

Обидва ці ефекти, як правило, призводять до відторгнення у двосхилому тесті, хоча обидва зразки мають однакову дисперсію . Це означає, що коли справжній розподіл є більш важким, ніж звичайний, фактичний рівень значущості, як правило, вище, ніж ми хочемо.

І навпаки, малювання зразка з більш легкої хвостової розподілу призводить до розподілу вибіркових дисперсій, які мають занадто короткий хвіст - значення дисперсії, як правило, більш "середні", ніж ви отримуєте з даних звичайних розподілів. Знову-таки, удар сильніший у дальній верхній хвіст, ніж нижній хвіст.

Тепер, якщо обидва зразки взяті з цього більш легкого хвоста, це призводить до перевищення значень F поблизу медіани і занадто мало в обох хвостах (фактичні рівні значущості будуть нижчими від бажаних).

Ці ефекти, схоже, не обов'язково значно зменшуються при збільшенні розміру вибірки; у деяких випадках, здається, стає гірше.

Для часткової ілюстрації, ось 10000 вибіркових дисперсій (для n=10 ) для нормальних, t5 та рівномірних розподілів, що мають масштаб, щоб мати таке ж значення, як χ92 :

введіть тут опис зображення

Далекий хвіст трохи важко побачити, оскільки він порівняно невеликий порівняно з піком (а для т5 спостереження в хвості простягаються справедливим шляхом повз те, де ми намітили), але ми можемо побачити щось, що впливає на розподіл на дисперсії. Це, мабуть, навіть більш повчально перетворити їх на обернення c-квадрата cdf,

введіть тут опис зображення

який у звичайному випадку виглядає рівномірним (як слід), у t-випадку має великий пік у верхньому хвості (і менший пік у нижньому хвості), а в рівномірному випадку - більше схожий на пагорб, але із широким пік близько 0,6 до 0,8, і крайності мають набагато меншу ймовірність, ніж повинні, якби ми відбирали вибірку із звичайних розподілів.

Це, в свою чергу, впливає на розподіл співвідношення дисперсій, які я описав раніше. Знову ж таки, щоб покращити нашу здатність бачити вплив на хвости (що може бути важко помітити), я перетворив обернену cdf (в даному випадку для Ж9,9

введіть тут опис зображення

т5

Для повного дослідження було б багато інших випадків, але це, принаймні, дає відчуття виду та спрямованості ефекту, а також того, як воно виникає.


1
Дійсно приємний демо
shadowtalker

3

Як Glen_b яскраво проілюстрував у своїх симуляціях, F-тест на співвідношення дисперсій чутливий до хвостів розподілу. Причиною цього є те, що дисперсія вибіркової дисперсії залежить від параметра куртозу, і тому куртоз основного розподілу сильно впливає на розподіл відношення дисперсій вибірки.

SN2Sn2n<N

SN2Sn2Approxn1N1+NnN1F(DFC,DFn),

κ

DFn=2нκ-(н-3)/(н-1)DЖС=2(N-н)2+(κ-3)(1-2/N+1/Nн).

У окремому випадку мекокуртичного розподілу (наприклад, нормального розподілу) у вас є κ=3DFn=n1DFC=Nn

κ^


N1N


+1 Це дуже цікавий пост. Звичайно, за допомогою мезокуртичних розподілів важче отримати розподіл коефіцієнта дисперсії, щоб бути якнайдалі від F, як це можливо, з повним діапазоном вибору розподілу, але це не так складно визначити випадки (за розміром вибірки у моїй відповіді, 10 і 10) де фактичний показник помилок типу I більше ніж трохи від номінальної 0,05. Перші 3 випадки, які я намагався (розподіли з куртозом населення = 3 - всі вони також симетричні), мали ступінь відхилення I типу 0,0379, 0,0745 та 0,0785. ...
ctd

ctd ... Я мало сумніваюся, що більш екстремальні випадки можна було б ототожнити, подумавши про те, як зробити наближення гіршим. Я гадаю, що він (щоб рівень значущості не сильно вплинув) міг би краще триматися у більшій вибірці.
Glen_b -Встановити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.