Чому багаторазові заходи ANOVA передбачають сферичність?


10

Чому багаторазові заходи ANOVA передбачають сферичність?

Під сферичністю я маю на увазі припущення, що дисперсія всіх парних відмінностей між групами повинна бути однаковою.

Зокрема, я не розумію, чому це повинно бути припущенням, а не те, що відхилення в оцінюваних групах самі по собі є однаковими.


1
Як я вже коментував тут , оскільки різницькі змінні між рівнями RM пов'язані за своїм походженням, сферичністю, то це означає, що вони мають однакові відхилення.
ttnphns

1
Перш ніж відповісти, було б корисно, якщо знати, чи розумієте ви, чому незалежні заходи ANOVA мають припущення про однорідність дисперсії.
Іван

@John Моє розуміння - це відповідь, надана на сайті stats.stackexchange.com/questions/81914/…, правильно відповідає на це питання.
user1205901

@ttnphns На жаль, я не дуже розумію вашу відповідь. Чи хотіли б ви чи якийсь інший афіша зацікавити його детальніше?
user1205901

Відповіді:


2

Інтуїція за припущенням про сферичність

Одне з припущень поширених не повторних заходів - ANOVA - рівномірність у всіх групах.

(Ми можемо це зрозуміти, тому що однакова дисперсія, відома також як гомоседастичність , потрібна для того, щоб Оцінювач OLS в лінійній регресії був ЧЕРНИМ , і щоб відповідні t-тести були дійсними, див . Теорему Гаусса – Маркова . А ANOVA може бути реалізована як лінійна регресія.)

Тож спробуємо звести випадок RM-ANOVA до випадку, що не належить до RM. Для простоти я буду мати справу з однофакторною RM-ANOVA (без будь-яких ефектів між суб'єктами), яка має суб'єктів, записаних у k RM умовах.нк

Кожен предмет може мати власний предметний зсув або перехоплення. Якщо ми віднімемо значення в одній групі від значень у всіх інших групах, ми скасуємо ці перехоплення і прийдемо до ситуації, коли ми зможемо використовувати не-RM-ANOVA для перевірки, чи всі ці різниці в групи дорівнюють нулю. Щоб цей тест був дійсним, нам потрібне припущення про однакові відмінності цих k - 1 різниць.к-1к-1

Тепер ми можемо відняти групу №2 від усіх інших груп, знову доходячи до різниць, які також повинні мати однакові відхилення. Для кожної групи поза k відхилення відповідних різниць k - 1 повинні бути рівними. З цього швидко випливає, що всі k ( k - 1 ) / 2 можливі різниці повинні бути рівними.к-1кк-1к(к-1)/2

Яке саме припущення про сферичність.

Чому групові відхилення не повинні самі бути рівними?

Коли ми думаємо про RM-ANOVA, ми зазвичай думаємо про простий адитивної моделі змішаної моделі-стилі виду де α я підвладний ефекти, β J є наслідки стану та ϵ N ( 0 , σ 2 ) .

уij=мк+αi+βj+ϵij,
αiβjϵN(0,σ2)

Для цієї моделі групові відмінності будуть дотримуватися , тобто всі матимуть однакову дисперсію 2 σ 2 , тому сферичність має місце. Але кожна група дотримуватиметься суміші n гауссів із засобами при α i та дисперсіях σ 2 , що є деяким складним розподілом із постійною дисперсією V ( α , σ 2 ) .N(βj1βj2,2σ2)2σ2nαiσ2V(α,σ2)

Так що в цій моделі, дійсно, і групові дисперсії теж однакові. Групові коваріації також однакові, це означає, що ця модель передбачає складну симетрію . Це більш сувора умова порівняно зі сферичністю. Як показує мій інтуїтивно зрозумілий аргумент, RM-ANOVA може чудово працювати в більш загальній ситуації, коли описана вище модель добавок не дотримується .

Точне математичне твердження

Я додам сюди щось із Huynh & Feldt, 1970, умови, за яких середні квадратні співвідношення у повторних моделях вимірювань мають точний розподілЖ .

Що відбувається, коли сферичність порушується?

Коли сферичність не дотримується, ми, ймовірно, можемо очікувати, що RM-ANOVA до (i) матиме завищений розмір (більше помилок типу I), (ii) має знижену потужність (більше помилок типу II). Можна вивчити це за допомогою симуляцій, але я не збираюся це робити тут.


4

Виявляється, наслідком порушення сферичності є втрата потужності (тобто підвищена ймовірність помилки типу II) та тестова статистика (відношення F), яку просто не можна порівняти з табличними значеннями розподілу F. F-тест стає занадто ліберальним (тобто частка відхилень нульової гіпотези перевищує рівень альфа, коли нульова гіпотеза є істинною.

Точне дослідження цієї теми дуже задіяне, але, на щастя, Box et al написали документ про це: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

Словом, ситуація така. По-перше, скажімо, у нас є однофакторне проектування повторних вимірювань з предметами S та експериментальне лікування. У цьому випадку ефект незалежної змінної перевіряється обчисленням статистики F, яка обчислюється як відношення середнього квадрата ефекту до середнього квадрата взаємодії між предметним фактором та незалежною змінною. Якщо сферичність дотримується, ця статистика має розподіл Фішера з і υ 2 = ( A - 1 ) ( S - 1 ) ступенями свободи.υ1=А-1υ2=(А-1)(S-1)

υ1ϵ

υ1=ϵ(А-1)
υ2=ϵ(А-1)(S-1)

ξа,а

ϵ=(аξа,а)2(А-1)а,а'ξа,а'2

Індекс сферичності Box найкраще зрозуміти стосовно власних значень матриці коваріації. Нагадаємо, що матриці коваріації належать до класу позитивних напіввизначених матриць і тому завжди мають додатні нульові власні значення. Таким чином, умова сферичності еквівалентно наявності всіх власних значень, рівних постійній.

Отже, коли сферичність порушена, ми повинні застосувати певну корекцію для нашої статистики F, і найбільш помітними прикладами цих виправлень є Greenhouse-Geisser та Huynh-Feldt, наприклад

Без жодних виправлень ваші результати будуть упередженими та настільки недостовірними. Сподіваюся, це допомагає!


+1. Я прокоментую більше пізніше, але поки ваш перший абзац змішує потужність і розмір тесту. Що порушується, коли сферичність порушена? Коефіцієнт помилок типу I під нулем? Або влада? Або обоє? Ви, мабуть, маєте на увазі і те, і інше, але формулювання не дуже зрозуміле (я думаю). Також це не "Box et al", це Box Box :)
амеба

Я думаю, що потужність буде значною мірою погіршена, тому що, як показав Бокс, коли сферичність порушується, ми повинні покладатися на зовсім іншу статистику (з іншим ступенем свободи). Якщо ми не покладаємось на це, то залежно від того, наскільки сильне наше порушення, ми матимемо більшу частку відхилень нульової гіпотези.
Великий академік

Вибачте, все ще плутайте ваш коментар: "більша частка відхилень нуля" - ви маєте на увазі, коли нуль насправді відповідає дійсності? Але це не має нічого спільного з потужністю, це рівень помилок типу I.
амеба

+10. Я присуджую свою винагороду за цю відповідь: це добре, а також це єдина відповідь, що з’явилася в період щедрості. Я не повністю задоволений вашою відповіддю (ще?), І я почав писати власну відповідь (наразі неповна, але вже розміщена), але маю лише часткове розуміння основної математики. Ваша відповідь, безумовно, допомогла, і посилання на поле 1954 теж дуже корисне.
амеба

ϵϵξА×А

1

уijкi=1,...,Я;j=1,...,J;к=1,...,К.

Середнє значення вибірки i-ї групи дорівнює

у¯i..=1JКj=1Jк=1Куijк

і що ij-го предмета є

у¯ij.=1Кк=1Куijк

Припускаючи незалежність серед предметів, різниця між різницею двох груп є

Vаr(у¯i..-у¯i'..)=1J2j=1JVаr(у¯ij.)+1J2j'=1JVаr(у¯i'j'.)

Vаr(у¯ij.)σ2/Кσ2Vаr(у¯ij.)

Тепер до питання сферичності, яке було порушено.

у¯..к-у¯..к'

у¯..к=1ЯJi=1Яj=1Jуijк.
уijкуijк'

Vаr(у¯..к-у¯..к')=1(ЯJ)2i=1Яj=1JVаr(уijк-уijк')

Отже, якщо припустити постійну дисперсію всіх парних різниць, це справедливо проводити t-тест, коли оцінюється загальна дисперсія. Це припущення разом із постійною дисперсією кожного спостереження означає, що коваріація між будь-якою парою вимірювань є постійною для всіх пар - Серхіоє чудовий пост на цю тему. Отже, припущення створюють дисперсійно-коваріаційну структуру для повторних вимірювань кожного суб'єкта у вигляді матриці з постійною діагоналлю та іншою постійною поза діагоналі. Коли значення позадіагональних записів дорівнюють нулю, воно зводиться до абсолютно незалежної моделі (що може бути недоцільним для багатьох повторних досліджень вимірювань). Якщо вимкнено діагональні записи такі ж, як діагональні, повторювані вимірювання ідеально співвідносяться для суб'єкта, тобто будь-яке вимірювання є таким же хорошим, як і всі вимірювання для кожного предмета. Підсумкове зауваження - коли K = 2 у нашому простому розбитому сюжетному дизайні, умова сферичності автоматично виконується.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.