Я припускаю, що ви маєте на увазі тест F на співвідношення дисперсій при тестуванні пари варіацій вибірки на рівність (адже це найпростіший, досить чутливий до нормальності; F-тест на ANOVA менш чутливий)
Якщо ваші зразки взяті з звичайних розподілів, дисперсія вибірки має масштабований розподіл квадратних чі
Уявіть, що замість даних, отриманих із звичайних дистрибутивів, у вас був розподіл, який був більш важким, ніж звичайний. Тоді ви отримаєте занадто багато великих дисперсій відносно розподіленого чи-квадратного розподілу, і ймовірність того, що вибіркова дисперсія потрапить у крайній правий хвіст, дуже чутливо реагує на хвости розподілу, з яких отримані дані =. (Буде також занадто багато невеликих дисперсій, але ефект трохи менш виражений)
Тепер, якщо обидва зразки витягнуті з цього більш важкого хвостового розподілу, більший хвіст на чисельнику призведе до перевищення великих значень F, а більший хвіст на знаменнику створить надлишок малих значень F (і навпаки для лівого хвоста)
Обидва ці ефекти, як правило, призводять до відторгнення у двосхилому тесті, хоча обидва зразки мають однакову дисперсію . Це означає, що коли справжній розподіл є більш важким, ніж звичайний, фактичний рівень значущості, як правило, вище, ніж ми хочемо.
І навпаки, малювання зразка з більш легкої хвостової розподілу призводить до розподілу вибіркових дисперсій, які мають занадто короткий хвіст - значення дисперсії, як правило, більш "середні", ніж ви отримуєте з даних звичайних розподілів. Знову-таки, удар сильніший у дальній верхній хвіст, ніж нижній хвіст.
Тепер, якщо обидва зразки взяті з цього більш легкого хвоста, це призводить до перевищення значень F поблизу медіани і занадто мало в обох хвостах (фактичні рівні значущості будуть нижчими від бажаних).
Ці ефекти, схоже, не обов'язково значно зменшуються при збільшенні розміру вибірки; у деяких випадках, здається, стає гірше.
Для часткової ілюстрації, ось 10000 вибіркових дисперсій (для n=10 ) для нормальних, t5 та рівномірних розподілів, що мають масштаб, щоб мати таке ж значення, як χ29 :
Далекий хвіст трохи важко побачити, оскільки він порівняно невеликий порівняно з піком (а для т5 спостереження в хвості простягаються справедливим шляхом повз те, де ми намітили), але ми можемо побачити щось, що впливає на розподіл на дисперсії. Це, мабуть, навіть більш повчально перетворити їх на обернення c-квадрата cdf,
який у звичайному випадку виглядає рівномірним (як слід), у t-випадку має великий пік у верхньому хвості (і менший пік у нижньому хвості), а в рівномірному випадку - більше схожий на пагорб, але із широким пік близько 0,6 до 0,8, і крайності мають набагато меншу ймовірність, ніж повинні, якби ми відбирали вибірку із звичайних розподілів.
Це, в свою чергу, впливає на розподіл співвідношення дисперсій, які я описав раніше. Знову ж таки, щоб покращити нашу здатність бачити вплив на хвости (що може бути важко помітити), я перетворив обернену cdf (в даному випадку для Ж9 , 9
т5
Для повного дослідження було б багато інших випадків, але це, принаймні, дає відчуття виду та спрямованості ефекту, а також того, як воно виникає.