Перевірка припущень ANOVA


16

Кілька місяців тому я опублікував запитання про тести на госседастичність в R на SO, і Ян Флоуз відповів, що (я перефразую його відповідь дуже вільно):

Тести на гомосексуальність не є хорошим інструментом для перевірки на придатність вашої моделі. З невеликими зразками у вас не вистачає сили для виявлення відхилень від гомоскедастичності, тоді як у великих зразків у вас є "достатня потужність", тому ви, швидше за все, виявите навіть тривіальні відступи від рівності.

Його велика відповідь прийшла як ляпас мені в обличчя. Я перевіряв припущення щодо нормальності та гомоскедастичності кожного разу, коли я запускав ANOVA.

Яка, на ваш погляд, найкраща практика під час перевірки припущень ANOVA?

Відповіді:


11

У застосованих налаштуваннях зазвичай важливіше знати, чи є якесь порушення припущень проблематичним для висновку.

Успішні тести, засновані на тестах на значущість, рідко представляють інтерес для великих зразків, оскільки більшість інфекційних тестів є стійкими до легких порушень припущень.

Однією з приємних особливостей графічних оцінок припущень є те, що вони фокусують увагу на ступені порушення, а не на статистичній значущості будь-якого порушення.

Однак також можна зосередитись на числових підсумках ваших даних, які кількісно оцінюють ступінь порушення припущень, а не статистичну значимість (наприклад, значення косості, значення куртозу, співвідношення найбільших до найменших дисперсій групи та ін.). Ви також можете отримати стандартні помилки або довірчі інтервали на цих значеннях, які будуть зменшуватися з більшими вибірками. Ця перспектива узгоджується із загальною думкою, що статистична значимість не рівнозначна практичній важливості.


1
+1 за чудову відповідь, яка все завершує. Як застосувати згадані чисельні процедури, добре і застосовно описано у Табачнику та Фіделлі, використовуючи багатовимірну статистику (для SPSS та SAS): amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/… (Але дивіться Erratas на супроводжує веб-сторінку)
Генрік

Ну, я вважаю, що більшість часу такі підсумки, як косоокість і куртоз, мають незначну цінність, їх вибіркова варіація просто велика. Однак можна подумати про заміну їх на L_skewness та L-kurtosis.
kjetil b halvorsen

@kjetilbhalvorsen Я думаю, це залежить від того, з якими типами вибірки ти зазвичай працюєш. На моєму досвіді, сюжети та статистика перекосів дуже корисні для розуміння розподілу даних.
Джеромі Англім

@Jeromy Anglim: Гаразд. Тоді я здогадуюсь, як правило, у вас дуже великі розміри зразків! Чи намагалися ви завантажувати коефіцієнти косості / куртозу?
kjetil b halvorsen

9

Пара графів, як правило, будуть набагато просвічуючими, ніж значення p від тесту на нормальність або гомоскедастичність. Графік спостерігав залежні змінні проти незалежних змінних. Сюжетні спостереження проти припадків. Позначення залишків проти незалежних змінних. Дослідіть усе, що на цих сюжетах виглядає дивно. Якщо щось не виглядає дивно, я б не переймався значним тестом припущення.


Хороша порада в більшості випадків, але як бути з великими наборами даних, де неможливо переглядати всі дані вручну?
dimimcha

1
n1n2<ασ2

2
@dsimcha re великих наборів даних: залежить від того, що ви маєте на увазі під "великим". Багато спостережень? Використовуйте хорошу графіку (boxplot, розтерзані точки, sunflowerplots). Багато незалежних змінних? Так, у вас є точка ... Але якщо у вас так багато IV, що ви не можете побудувати DV проти кожного IV, я б запитав, використовуючи ANOVA взагалі - схоже, це може бути важко інтерпретувати в будь-якому справа. Деякі підходи до розумного машинного навчання можуть бути кращими (Брайан Д. Ріплі: "Якщо перефразовувати провокаційно," машинне навчання - це статистика мінус будь-яка перевірка моделей та припущень ".)
Стефан Коласа,

Хороший коментар, +1. Незважаючи на те, що це конкретне питання стосується ANOVA, я думав на більш загальному рівні над питанням сюжетів проти тестів, коли писав свою відповідь.
dimimcha

4

Ось кілька дуже хороших веб-посібників для перевірки припущень ANOVA і що робити, якщо не вдалося. Ось один. Це вже інше.

По суті ваше око є найкращим суддею, тому зробіть кілька дослідницьких аналізів . Це означає, що описують дані - гістограми та графічні графіки є хорошим способом оцінки нормальності та гомосхедичності. І пам’ятайте, ANOVA є стійким до незначних порушень.


4

Сюжети QQ - це досить хороші способи виявити ненормальність.

Для отримання гомоскедастичності спробуйте тест Левене або тест Брауна-Форсайта. Обидва схожі, хоча BF трохи надійніший. Вони менш чутливі до ненормальності, ніж тест Бартлетта, але навіть все-таки я виявив, що вони не є найбільш надійними з невеликими розмірами вибірки.

QQ сюжет

Тест Брауна-Форсайта

Випробування Левене


Діаграми відносної дистрибуції (або, наприклад, порівняння зі звичайним розподілом) можуть бути хорошою заміною, оскільки їх інтерпретація може бути зрозумілішою для початківців.
kjetil b halvorsen

3

Я погоджуюся з іншими, що перевірка значимості припущень є проблематичною.

Мені подобається вирішувати цю проблему, створюючи єдиний сюжет, який викриває всі припущення щодо моделі, необхідні для точної помилки I типу та низької помилки II типу (велика потужність). Для випадку ANOVA з двома групами (дві вибіркові t-випробування) цей графік є нормальною оберненою емпіричною функцією кумулятивного розподілу (ECDF), стратифікованої за групою (див. Коментар сюжету QQ у попередньому дописі). Щоб t-тест працював добре, дві криві повинні бути паралельними прямими. Дляк-приклад проблеми ANOVA взагалі ви мали б к паралельні прямі.

Напівпараметричні (рангові) методи, такі як тести Вілкоксона та Крускала-Уолліса, роблять набагато менше припущень. Логіт ECDF повинен бути паралельним, щоб тести Вілкоксона-Крускала-Уолліса мали максимальну потужність (помилка I типу для них ніколи не є проблемою). Лінійність не потрібна. Ранкові тести роблять припущення про те, як розподіли різних груп пов'язані з іншими, але не роблять припущень щодо форми будь-якого одного розподілу.


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.