Чи неправильно використовувати ANOVA замість t-тесту для порівняння двох засобів?


11

У мене розподіл зарплат і я хочу порівняти різницю в засобах для чоловіків і жінок. Я знаю, що є студентський тест для порівняння двох засобів, але після того, як запропонував ANOVA, я отримав певну критику, сказавши, що ANOVA - це порівняння більш ніж двох засобів.

Що (якщо що-небудь) не так у використанні для порівняння лише двох засобів?


9
Хто каже, що це неправильно?
gung - Відновити Моніку

1
Чому б вам не переформулювати питання, що придушує будь-які припущення? Щось уздовж рядка "Чи еквівалентний ANOVA t-тесту при порівнянні двох груп?" Просто ідея ... Я не нестиму відповідальності за те, як вітається питання в будь-якому випадку :-)
Антоні Парелада,

4
Крім того, змініть своє запитання, щоб показати, хтось сказав, що це неправильно ... щоб ми могли пояснити, що вони помиляються. Тут складність полягає в тому, що передумова питання (що це неправильно) помиляється.
Glen_b -Встановіть Моніку

1
Хоча передумова помиляється, це питання, здається, не є темою або настільки неясним, на нього не можна відповісти (дійсно, на нього відповіли). Я думаю, що це може залишатися відкритим.
gung - Відновити Моніку

1
Домовились, @ gung. Я думаю, що питання відображає брак знань з теми. Якби це було сформульовано інакше (або «краще»), то, ймовірно, питання не ставили б, бо тоді вони вже знали б відповідь.
D_Williams

Відповіді:


20

Це не є помилковим і буде еквівалентним на тесті, який передбачає рівні відхилення. Більше того, з двома групами sqrt (f-статистика) дорівнює (значення абослоту) t-статистики. Я дещо впевнений, що t-тест з неоднаковими відхиленнями не рівнозначний. Оскільки ви можете отримати відповідні оцінки, коли дисперсії неоднакові (відхилення, як правило, завжди неоднакові до десяткового знаку), можливо, має сенс використовувати t-тест, оскільки він є більш гнучким, ніж ANOVA (якщо вважати, що у вас є лише дві групи).

Оновлення:

Ось код, який показує, що t-статистика ^ 2 для t-тесту з рівномірною дисперсією, але не неоднакова t-тест, така ж, як f-статистика.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

3
+1, зауважте, що можна налаштувати односторонній тест ANOVA / F на нерівні відхилення (пор. Альтернативи односторонній ANOVA для гетерокедастичних даних ).
gung - Відновіть Моніку

@gung ОК. Я не був впевнений у цьому, оскільки я не використовував ANOVA колись (робив байєсівську справу).
D_Williams

Є ще одна перевага виконання тестів: якщо у вас є гіпотеза спрямованості, ви можете виконати односхилий тест; З іншого боку, ANOVA завжди перевіряє непрямі гіпотези. тtt
crsh

4

Вони рівноцінні. ANOVA, що містить лише дві групи, еквівалентний t-тесту. Різниця полягає в тому, що у вас декілька груп, тоді помилка типу I зросте для t-тестів, оскільки ви не зможете спільно перевірити гіпотезу. ANOVA не страждає від цієї проблеми, коли ви спільно їх тестуєте за допомогою F-тесту.


1
Я не думаю, що він втрачає силу, я думаю, що це має більше спільного з помилками типу I. Загалом, чим більше у вас випробувань, тим вища потужність ви повинні отримати.
HelloWorld

Я вважаю (як говорить @StudentT), це питання помилок I типу. Звичайно, я вважаю, що вони змушують нас використовувати саме «Корекцію Бонферроні» саме для цього. en.wikipedia.org/wiki/Bonferroni_correction
Пабло Фернандес

Так, ти прав. Це має бути не помилка (тип II), а помилка I типу. Я вважаю, що міркування правильні, але я чомусь написав владу, а не помилку 1 типу. Я відредагую, щоб переконатися, що я нікого не обманюю.
robinsa
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.