Якщо t-тест і ANOVA для двох груп рівнозначні, чому їх припущення не еквівалентні?


47

Я впевнений, що у мене це цілком загорнута голова, але я просто не можу це зрозуміти.

T-тест порівнює два звичайних розподілу, використовуючи розподіл Z. Ось чому існує припущення про нормальність у DATA.

ANOVA еквівалентна лінійній регресії з фіктивними змінними і використовує суми квадратів, як і OLS. Ось чому існує припущення про нормальність залишків.

Минуло кілька років, але я думаю, що нарешті зрозумів ці основні факти. То чому так, що t-тест еквівалентний ANOVA з двома групами? Як вони можуть бути рівнозначними, якщо вони навіть не припускають однакових даних щодо даних?


15
Один момент: t-тести використовують розподіл t, а не розподіл Z
Jeromy Anglim

1
Хоча питання невірне, воно дуже корисне. Крім того, я думаю, що згадування "двох хвостих тестів" десь зробить запитання / відповіді більш повними.
Гаурав Сінгхал

Відповіді:


29

Т-тест з двома групами передбачає, що кожна група зазвичай розподіляється з однаковою дисперсією (хоча засоби можуть відрізнятися за альтернативної гіпотези). Це еквівалентно регресії з фіксованою змінною, оскільки регресія дозволяє середньому для кожної групи відрізнятися, але не дисперсії. Отже, залишки (рівні дані з групою означає відняті) мають однаковий розподіл --- тобто вони зазвичай розподіляються з нульовим середнім.

Т-тест з нерівними відхиленнями не рівнозначний односторонньому ANOVA.


3
Я можу знайти цитування, але це досить просто, щоб перевірити емпірично. F від ANOVA з двома групами точно дорівнює t ^ 2, і значення p будуть точно однаковими. Єдина причина, яка б не була рівнозначною у випадку неоднакових відхилень, - це якщо ви застосуєте виправлення. Інакше вони однакові.
Бретт

3
F-тест - це узагальнення t тесту. t-тест призначений для порівняння 2 лікування, а тест F - для багаторазового лікування. Виведення є у статистичному дизайні Казелли, Глави 3 та 4. Однак, як зазначає проф. Хайндман, з неоднаковими відхиленнями це вже не є тестом. Це проблема Фішера Берена. Ми, як правило, не використовуємо рішення Фішера, натомість використовуємо тест Вельча або байєсівський підхід.
suncoolsu

Двопробний t-тест з неоднаковими відхиленнями дійсно дорівнює односторонньому ANOVA з двома групами. Можливо, ви мали на увазі те, що t-тест, що використовує корекцію для неоднакових дисперсій (тобто Welch), не є таким, як одностороння ANOVA, яка не виправляється (хоча чому б це було)?
Бретт

20

T-тест - просто особливий випадок F-тесту, де порівнюються лише дві групи. Результат будь-якого буде абсолютно однаковий з точки зору p-значення, і між статистикою F і t є просте співвідношення. F = t ^ 2. Два тести є алгебраїчно еквівалентними, і їхні припущення однакові.

Насправді ці еквіваленти поширюються на весь клас ANOVAs, t-тестів та лінійних моделей регресії. T-тест - це особливий випадок ANOVA. ANOVA - особливий випадок регресу. Усі ці процедури підпадають під загальну лінійну модель і мають однакові припущення.

  1. Незалежність спостережень.
  2. Нормальність залишків = нормальність у кожній групі в окремому випадку.
  3. Рівня відхилень залишків = однакові відхилення у групах у спеціальному випадку.

Ви можете вважати це нормальністю даних, але ви перевіряєте нормальність у кожній групі - що насправді те саме, що перевірка на нормальність у залишках, коли єдиним провісником у моделі є показник групи. Аналогічно з рівними відхиленнями.

Як і вбік, R не має окремих процедур для ANOVA. Функції anova в R - це лише обгортки для функції lm () - те саме, що використовується для підгонки лінійних регресійних моделей - пакується дещо інакше, щоб забезпечити те, що зазвичай знаходиться в резюме ANOVA, а не резюме регресії.


Було б цікаво дізнатись, як підігнати повторні заходи для моделей ANOVA за допомогою lm.
AndyF

1
Питання кодування категоричних змінних, еквівалентності регресійних та ANOVA моделей та регресійного кодування для повторних заходів описані в цій статті. dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/… Ось цитування ... Wendorf, CA (2004). Праймер для кодування множинної регресії: загальні форми та додатковий випадок повторних контрастів. Розуміння статистики 3, 47-57.
Бретт

4
@AndyF Чи не lm(), якщо ви не транспортувалися змішані моделі з nlmeабо lme4пакетом, але є зручний спосіб для обробки повторних вимірів за допомогою відповідних технічних Errorтерміна в aov(), докладніше про Baron & Li підручник, §6.9, j.mp/ c5ME4u
хл

@AndyF aov()побудований на вершині lm()функції, але включає додатковий аргумент , на зразок Спеціальних термінів, наприклад Error.
chl

aov () - просто обгортка для lm (). Це робить деяке контрастне кодування за кадром і пакує результат у стилі ANOVA. Все це моделюється lm (). У статті, на яку я посилався вище, розповідається, як налаштувати кодування для повторних контрастів у регресійних моделях, включаючи lm ().
Бретт

17

Я повністю згоден з відповіддю Роб, але дозвольте сказати іншим способом (за допомогою wikipedia):

Припущення ANOVA :

  • Незалежність випадків - це припущення про модель, яка спрощує статистичний аналіз.
  • Нормальність - розподіл залишків нормальний.
  • Рівність (або «однорідність») дисперсій, що називається гомоскедастичністю

Т-тест припущень :

  • Кожна з двох порівнюваних груп повинна дотримуватися нормального розподілу ...
  • ... дві порівнювані групи повинні мати однакову дисперсію ...
  • Дані, використані для проведення тесту, слід відбирати незалежно від двох популяцій, що порівнюються.

Отже, я спростую питання, оскільки вони, очевидно, мають однакові припущення (хоча в іншому порядку :-)).


Дивіться коментар до Роб.
Олексій

@ Алексис Я не впевнений, що я розумію твою протиправку. Дбайливо розробити.
Генрік

Припущення другого t тесту не відповідає дійсності. Первісна робота студента передбачала це, але "нерівні відхилення" є досить поширеним припущенням для подальшого лікування тесту.
Олексій

5

Один очевидний момент, який всі не помічають: З ANOVA ви перевіряєте нуль, що середнє значення тотожне незалежно від значень ваших пояснювальних змінних. За допомогою T-тесту ви також можете перевірити односторонній випадок, що середнє значення конкретно більше, ніж одне значення вашої пояснювальної змінної, ніж інше.


1
Якщо я не помиляюся, це НЕ різниця. Якщо ви робите ANOVA на двох групах, тоді ви можете зробити "однобічний тест" так само, як і в t-тесті. Я ставлю "однобічний тест" у лапки, оскільки насправді різниці між "одностороннім тестом" та "двостороннім тестом" немає. Різниця полягає лише в тому, як ви інтерпретуєте статистичну значущість p-значень. Тож односторонні та двосторонні "тести" - це абсолютно той самий "тест". Тільки спосіб правильної інтерпретації результатів різний.
Tripartio

-3

Я вважаю за краще використовувати t-тест для порівняння двох груп і буду використовувати ANOVA для більш ніж 2 груп з причини. Важливою причиною є припущення про рівні дисперсії.


5
Ласкаво просимо на сайт, @syed. Чи б ви проти розширити свою відповідь? Наприклад, про які "причини" ви посилаєтесь? Зауважте, що і t-test, і ANOVA припускають однакові відмінності.
gung - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.