Як я можу отримати значну загальну ANOVA, але немає значних парних відмінностей від процедури Tukey?


18

Я виступав з R ANOVA і отримав значні відмінності. Однак, перевіряючи, які пари суттєво відрізнялися за допомогою процедури Tukey, я не отримав жодної з них. Як це можливо?

Ось код:

fit5_snow<- lm(Response ~ Stimulus, data=audio_snow)
anova(fit5_snow)

> anova(fit5_snow)
Analysis of Variance Table

Response: Response
          Df Sum Sq Mean Sq F value  Pr(>F)  
Stimulus   5  73.79 14.7578  2.6308 0.02929 *
Residuals 84 471.20  5.6095                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

df<-df.residual(fit5_snow)
MSerror<-deviance(fit5_snow)/df

comparison <-  HSD.test(audio_snow$Response, audio_snow$Stimulus, df, MSerror, group=FALSE)

> comparison <-  HSD.test(audio_snow$Response, audio_snow$Stimulus, df, MSerror, group=FALSE)

Study:

HSD Test for audio_snow$Response 

Mean Square Error:  5.609524 

audio_snow$Stimulus,  means

                audio_snow.Response   std.err replication
snow_dry_leaves            4.933333 0.6208034          15
snow_gravel                6.866667 0.5679258          15
snow_metal                 6.333333 0.5662463          15
snow_sand                  6.733333 0.5114561          15
snow_snow                  7.333333 0.5989409          15
snow_wood                  5.066667 0.7713110          15

alpha: 0.05 ; Df Error: 84 
Critical Value of Studentized Range: 4.124617 

Comparison between treatments means

                              Difference   pvalue sig        LCL      UCL
snow_gravel - snow_dry_leaves  1.9333333 0.232848     -0.5889913 4.455658
snow_metal - snow_dry_leaves   1.4000000 0.588616     -1.1223246 3.922325
snow_sand - snow_dry_leaves    1.8000000 0.307012     -0.7223246 4.322325
snow_snow - snow_dry_leaves    2.4000000 0.071587   . -0.1223246 4.922325
snow_wood - snow_dry_leaves    0.1333333 0.999987     -2.3889913 2.655658
snow_gravel - snow_metal       0.5333333 0.989528     -1.9889913 3.055658
snow_gravel - snow_sand        0.1333333 0.999987     -2.3889913 2.655658
snow_snow - snow_gravel        0.4666667 0.994348     -2.0556579 2.988991
snow_gravel - snow_wood        1.8000000 0.307012     -0.7223246 4.322325
snow_sand - snow_metal         0.4000000 0.997266     -2.1223246 2.922325
snow_snow - snow_metal         1.0000000 0.855987     -1.5223246 3.522325
snow_metal - snow_wood         1.2666667 0.687424     -1.2556579 3.788991
snow_snow - snow_sand          0.6000000 0.982179     -1.9223246 3.122325
snow_sand - snow_wood          1.6666667 0.393171     -0.8556579 4.188991
snow_snow - snow_wood          2.2666667 0.103505     -0.2556579 4.788991

Чи можете ви надати дані?
ttnphns

1
Я знайшов відповідь на це пізніше запитання stats.stackexchange.com/questions/74174/… (позначений як дублювання цієї теми ) особливо корисним.
Амеба каже, що повернеться до Моніки

Відповіді:


2

Чому це не можливо?

Загальний тест і парний тест задають різні запитання, тому вони можуть отримати різні відповіді.


1
Скажіть, будь ласка, більше.
rolando2

2
Загальна ANOVA задає питання про всю незалежну змінну та її зв’язок (або її відсутність) із залежною змінною. Паральні порівняння запитують про відмінності між парами. Тоді p-значення дивиться на статистичну sig. кожного з них, з парним регулюванням для декількох порівнянь (у цьому випадку, використовуючи методи HSD Tukey).
Пітер Флом - Відновити Моніку

1
спасибі, Пітер. Можливо, менше, ніж вони задають "різні запитання", а більше коригування для декількох порівнянь, що пояснює різний результат.
rolando2

17

В основному це пов'язано з чутливістю ANOVA (більшою, ніж чутливість до парного тесту). Потім ANOVA виявляє меншу мінливість навколо середнього, коли парний тест навряд чи розрізняє середнє значення пари. Аналіз повинен зосереджуватись на відмінностях, і ви можете бути більш гнучкими у процесі спеціального аналізу, маючи на увазі, що ви щойно стикалися з наявністю відмінностей у середньому. Не забудьте перевірити припущення ANOVA.

З іншого боку, є деякі теми, що стосуються використання парного тесту без використання ANOVA: чи потрібен нам глобальний тест перед пост-спеціальними тестами?


Однозначно не потрібен глобальний тест перед тим, як робити порівняння hdd Tukey, оскільки hsd контролює рівень помилок типу I. Я ненавиджу їх називати пост-хоками, тому що їх слід планувати апріорі.
Девід Лейн
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.