Припустимо, я маю експеримент з двома і більше факторами. Загальна ANOVA будується, і потім ми проводимо подальші дії з двома або більше наборами пост-спеціальних тестів, скажімо, декілька порівнянь. Моє запитання - про те, наскільки великі --- і скільки --- сімей повинні бути використані як основа для коригування кратності цих пост-спеціальних тестів.
Прикладом може слугувати набір викривлених даних із книги Тукі про EDA. Є два фактори: wool
(на двох рівнях) та tension
(на трьох рівнях). Таблиця ANOVA:
Source Df Sum Sq Mean Sq F value Pr(>F)
wool 1 450.7 450.67 3.7653 0.0582130
tension 2 2034.3 1017.13 8.4980 0.0006926
wool:tension 2 1002.8 501.39 4.1891 0.0210442
Residuals 48 5745.1 119.69
Зрозуміло, що взаємодія потрібна в моделі. Тому ми вирішуємо порівняти рівні кожного фактора, тримаючи інший фактор фіксованим. Результати наведені нижче, з деякими примітками, про які потрібно згадати пізніше:
*** Pairwise comparisons of tension for each wool ***
*** All combined: Family T ***
wool = A: *** Family T|A ***
contrast estimate SE df t.ratio
L - M 20.5555556 5.157299 48 3.986
L - H 20.0000000 5.157299 48 3.878
M - H -0.5555556 5.157299 48 -0.108
wool = B: *** Family T|B ***
contrast estimate SE df t.ratio
L - M -0.5555556 5.157299 48 -0.108
L - H 9.4444444 5.157299 48 1.831
M - H 10.0000000 5.157299 48 1.939
*** Comparison of wool for each tension ***
*** All combined: Family W ***
tension = L: *** Family W|L ***
contrast estimate SE df t.ratio
A - B 16.333333 5.157299 48 3.167
tension = M: *** Family W|M ***
contrast estimate SE df t.ratio
A - B -4.777778 5.157299 48 -0.926
tension = H: *** Family W|H ***
contrast estimate SE df t.ratio
A - B 5.777778 5.157299 48 1.120
Я думаю, що існують різні практики, і мені цікаво, які є найпоширеніші та які аргументи люди висловлюють за чи проти кожного підходу. Чи обчислюємо коригувані значення , чи слід робити коригування кратності для ...
- кожна з п’яти найменших сімей (T | A, T | B, ..., W | H) окремо? (Примітка. Останні 3 сім’ї мають лише один тест, щоб не було коригування кратності для цих)
- кожна з більших сімей (Т, з 6 тестами і W, з 3 тестами) окремо?
- всі тестів, які вважаються однією великою родиною?
Мене цікавить і те, що зазвичай роблять люди (навіть якщо вони не багато про це думали), і чому (якщо вони є). Я можу зазначити кілька речей:
- У таблиці ANOVA є 3 тести наЯ не пам'ятаю, як хтось розглядав коригування кратності на тестах ANOVA. Якщо це так, і ви рекомендуєте варіант (3), чи не відповідаєте ви?
- Якби ми провели дещо менший експеримент, де всі тести є менш потужними, можливо, взаємодія не була б істотною, що призвело б до набагато меншої кількості пост-спеціальних порівнянь лише граничних засобів. Більше того, граничні засоби цілком можуть мати менші СЕ, ніж засоби, що мають клітини у більшому експерименті. Якщо, крім того, коригування кратності менш консервативне, ми могли б мати більш "значні" результати з меншою кількістю даних, ніж у нас з більшою кількістю даних.
Цікаво подивитися, що люди мають сказати ...