Відступ від припущення щодо нормальності в ANOVA: чи важливіший куртоз чи косостість?


12

Прикладні лінійні статистичні моделі від Kutner et al. йдеться про наступне, що стосується відхилень від норми припущення щодо моделей ANOVA: Куртоз розподілу помилок (або більше, або максимум, ніж звичайний розподіл) важливіший, ніж спотвореність розподілу з точки зору впливу на умовиводи .

Я трохи спантеличений цим твердженням і не встиг знайти жодної пов’язаної інформації ні в книзі, ні в Інтернеті. Я розгублений, тому що я також дізнався, що QQ-графіки з важкими хвостами є свідченням того, що припущення про нормальність є "досить хорошим" для лінійних регресійних моделей, тоді як перекошені QQ-графіки викликають більше занепокоєння (тобто перетворення може бути доцільним) .

Чи я правда, що те ж міркування стосується і ANOVA і що їх вибір слів ( важливіший з точки зору впливу на умовиводи ) був обраний лише погано? Тобто перекошене поширення має більш важкі наслідки і слід уникати, тоді як невелика кількість куртозу може бути прийнятною.

EDIT: Як звертався до rolando2, важко стверджувати, що одне важливіше, ніж інше у всіх випадках, але я просто шукаю деякого загального розуміння. Моє основне питання полягає в тому, що мене вчили, що в простому лінійному регресії QQ-графіки з більш важкими хвостами (= куртоз?) В порядку, оскільки F-тест проти цього досить надійний. З іншого боку, перекошені QQ-ділянки (у формі параболи) зазвичай викликають більшу стурбованість. Це, мабуть, суперечить тим принципам, які в моєму підручнику передбачено для ANOVA, навіть якщо моделі ANOVA можуть бути перетворені на регресійні моделі і повинні мати ті самі припущення.

Я переконаний, що щось пропускаю або маю помилкове припущення, але не можу зрозуміти, що це може бути.


3
У своєму огляді на куртоз Декарло (1997) припустив саме зворотне, що перекос був важливішим у ANOVA та інших тестах рівності засобів. Цитати на сторінці 297 можуть бути корисними: columbia.edu/~ld208/psymeth97.pdf
Ентоні

1
Я вважаю це питання найпродуктивнішим, якби його можна було вирішити у твердженні, наприклад, "Нахил настільки важливіший для висновків, ніж куртоз, що косості на рівні ___ зазвичай спотворюють результати настільки ж, як і куртоз на рівні ___ . " Без деякої такої кількісної оцінки просто сказати те чи інше важливіше не дуже допомагає нам.
rolando2

Цей імітаційний emis.de/journals/HOA/ADS/Volume7_4/206.pdf Хан та Рейнер (2003) у " Журналі прикладних математичних та наукових рішень" зазначає, що "І курси ANOVA, і Крускал-Уолліс значно сильніше постраждали від куртозу. розподілу помилок, а не через її спотвореність "(с. 204).
bsbk

Надзвичайно тісне питання, що стосується двопробного t-тесту - фактично одностороннього ANOVA з двома рівнями коефіцієнта - є stats.stackexchange.com/questions/38967/… ... В даний час існує ще велика сума для додавання посилання, оскільки жодна з існуючих відповідей не містить цитат, тому відповіді на це питання, можливо, захочуть поглянути на це.
Срібна рибка

Я погоджуюся з @ rolando2: "косостість гірша, ніж куртоз", або навпаки, є досить вагомим твердженням, не згадуючи ступінь косості / куртозу. Але також потрібно враховувати більше! Наприклад, стійкість до подібних порушень нормальності частково залежить від того, чи однакові розміри групи , а стійкість до косості може залежати від напрямку косості - гірше, якщо одна група одна перекошена в одну сторону, а інша група перекосила навпаки, ніж якби обидві групи були перекошеними в одному напрямку. (Це з пам'яті та повторних тестів, але це тип ANOVA.)
Silverfish

Відповіді:


6

Складність полягає в тому, що косоокість і куртоз залежать; їх наслідки неможливо повністю розділити.

Проблема полягає в тому, що якщо ви хочете вивчити ефект сильно розповсюдженого перекосу, ви також повинні мати розподіл з високим куртозом.

Зокрема, куртоз * нахильність .2+1

* (звичайний масштабований куртоз четвертого моменту, а не зайвий куртоз)

Хан та Рейнер (про що йдеться у попередній відповіді) працюють із сім'єю, яка дозволяє дослідити вплив косості та куртозу, але вони не можуть уникнути цього питання, тому їх спроба відокремити їх суттєво обмежує ступінь впливу косості можна дослідити.

Якщо утримувати куртоз ( ) постійним, то не можна зробити косу більш ніж . Якщо хочеться розглянути одномодальні розподіли, косисть ще більше обмежується.β2β2-1

Наприклад, якщо ви хочете побачити ефект високої косості - скажімо, косості> 5, ви не можете отримати розподіл з куртозом менше 26!

Отже, якщо ви хочете дослідити вплив високої косості, ви не зможете уникнути дослідження впливу високого куртозу. Отже, якщо ви намагаєтеся відокремити їх, ви фактично не можете оцінити ефект посилення косості до високих рівнів.

При цьому, принаймні, для сімейства розподілу, яку вони вважали, і в межах, що їх стосуються, слідство Хана та Рейнера, здається, говорить про те, що куртоз є основною проблемою.

Однак, навіть якщо висновок є цілком загальним, якщо у вас трапляється розподіл з (скажімо,) косості 5, швидше за все, це буде невеликий комфорт, щоб сказати, "але це не проблема косості!" - як тільки ваша косоокість є , ви не можете отримати куртоз таким, як нормальний, і, крім того, мінімально можливий куртоз швидко зростає зі збільшенням косості.>2


11

Це питання розглянуто у «Надійності нестандартності загальних тестів для багатопробної проблеми локації» Хана та Рейнера.

Вони виявили, що тести ANOVA значно більше потерпають від куртозу, ніж косості, і ефект косості не пов'язаний з його напрямком.

Якщо підозрюють відхилення від нормальності, кращий вибір може бути тестом Крускала-Уолліса. Тест Крускала-Уолліса є більш стійким до відхилень від нормальності, оскільки він вивчає гіпотезу про те, що медіани лікування однакові. ANOVA вивчає гіпотезу про те, що засоби лікування однакові.


Це також означає, що я повинен інтерпретувати QQ-графіки по-різному для лінійної регресії та ANOVA? Більшість перетворень, які я здійснив, зменшили косисть, але залишили трохи важкі хвости (= куртоз?). У мене було враження, що F-тест був достатньо надійним, щоб вирішити питання з останнім, але не з першим. Або це "важкі хвости в порядку" з мого боку непорозуміння? Я не можу уявити, що існує така принципова різниця між цими двома, оскільки моделі ANOVA також можна переписати як лінійні регресійні моделі.
Зеніт
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.