Просто для посилення - я вважаю, що я останній запитувач.
У конкретному коментарі до пунктів Майка:
Цілком вірно, що різниця I / II / III застосовується лише з корельованими прогнозами (з яких незбалансовані конструкції є найпоширенішим прикладом, безумовно, у факторних ANOVA) - але це, як мені здається, є аргументом, який відхиляє аналіз неврівноваженої ситуації (а отже, будь-які дебати типу I / II / III). Це може бути недосконалим, але саме так і відбувається (і в багатьох контекстах витрати на подальший збір даних переважають над статистичною проблемою, незважаючи на це).
Це цілком справедливо і являє собою м'ясо більшості аргументів "II проти III, надаючи перевагу II", які я натрапив. Найкращий підсумок, з яким я стикався, - це Лангсруд (2003) "ANOVA для незбалансованих даних: Використовуйте тип II замість сум III типів", "Статистика та обчислення" 13: 163-167 (у мене є PDF, якщо оригінал важко знайти ). Він стверджує (беручи до уваги двофакторний випадок як основний приклад), що якщо є взаємодія, то існує взаємодія, тому розгляд основних ефектів зазвичай безглуздий (очевидно, справедливий момент) - а якщо взаємодії немає, аналіз типу II Основні ефекти є більш потужними, ніж тип III (безсумнівно), тому завжди слід переходити з типом II. Я бачив інші аргументи (наприклад, Venables,
І я згоден з цим: якщо у вас є взаємодія, але у вас є питання щодо головного ефекту, то ви, мабуть, перебуваєте на території робити самі.
Зрозуміло, що є ті, хто просто хоче типу III, оскільки це робить SPSS, або якесь інше посилання на статистичні вищі органи. Я не повністю проти цієї точки зору, якщо справа зводиться до вибору багатьох людей, які дотримуються SPSS (проти чого я маю деякі речі, а саме час, гроші та умови закінчення терміну дії ліцензії) та тип III SS, або багато люди, які переходять на R і III тип СС. Однак цей аргумент явно є кульгавим статистично.
Однак аргумент, який я виявив досить вагомим на користь типу III, - це аргумент, зроблений незалежно Myers & Well (2003, "Науково-дослідний дизайн та статистичний аналіз", с. 323, 626-629) та Maxwell & Delaney (2004, " Проектування експериментів та аналіз даних: перспектива порівняння моделі ", с. 324-328, 332-335). Це так:
- якщо є взаємодія, всі методи дають однаковий результат для суми взаємодії квадратів
- Тип II передбачає відсутність взаємодії для перевірки основних ефектів; тип III не відповідає
- Деякі (наприклад, Лангсруд) стверджують, що якщо взаємодія не є істотною, ви обгрунтовуєте припущення, що такого немає, і дивлячись на (більш потужні) основні ефекти типу II
- Але якщо тест на взаємодію недостатній, все-таки існує взаємодія, взаємодія може вийти «незначною», але все-таки призведе до порушення припущень тесту на основні ефекти типу II, зміна цих тестів буде занадто ліберальною. .
- Майєрс і Ну цитують Аппельбаума / Креймера як основних прихильників підходу типу II, і продовжуємо [p323]: "... Можна використовувати більш консервативні критерії несуттєвості взаємодії, наприклад, вимагаючи, щоб взаємодія не була суттєвою при рівень .25, але недостатньо розуміння наслідків навіть такого підходу. Як правило, суми квадратів II типу не повинні обчислюватися, якщо тільки не існує вагомих апріорних причин вважати відсутність ефектів взаємодії та явно несуттєва взаємодія сума квадратів ". Вони цитують [p629] В цілому Lee & Hornick 1981 як демонстрація того, що взаємодії, які не наближаються до значущості, можуть зміщувати тести основних ефектів. Maxwell & Delaney [p334] виступають за підхід типу II, якщо взаємодія населення дорівнює нулю, і підхід типу III, якщо він не є [для інтерпретації засобів, похідних від цього підходу]. Вони занадто виступають за використання типу III у реальній ситуації (коли ви робите висновки про наявність взаємодії з даних) через проблему зробити помилку [2, що недостатньо працює] в тесті взаємодії і, таким чином, випадково порушити припущення щодо типу підходу типу II; Потім вони роблять подібні додаткові моменти до Myers & Well і відзначають довгі дискусії з цього питання! повторний висновок про наявність взаємодії з даних) через проблему помилки в тесті взаємодії типу 2 [тим, що недостатньо], і, таким чином, випадково порушивши припущення підходу SS II типу; Потім вони роблять подібні додаткові моменти до Myers & Well і відзначають довгі дискусії з цього питання! повторний висновок про наявність взаємодії з даних) через проблему помилки в тесті взаємодії типу 2 [тим, що недостатньо], і, таким чином, випадково порушивши припущення підходу SS II типу; Потім вони роблять подібні додаткові моменти до Myers & Well і відзначають довгі дискусії з цього питання!
Отже, моє тлумачення (і я не експерт!) Полягає в тому, що в обох сторонах аргументу є достатньо Вищого статистичного органу; що звичайні аргументи висловлюються не про звичайну ситуацію, яка б породжувала проблеми (ця ситуація є звичайною інтерпретацією основних ефектів при несуттєвій взаємодії); і що є справедливі причини бути занепокоєними щодо підходу типу II у цій ситуації (і це зводиться до влади проти потенціалу надлібералізму).
Для мене цього достатньо, щоб побажати варіанту типу III в ezANOVA, а також типу II, тому що (за мої гроші) це чудовий інтерфейс до ANOVA-систем R. На мій погляд, R є певним способом від простоти у використанні для новачків, і пакет "ez" із ezANOVA та досить чудовим функцією побудови ефекту проходить довгий шлях до того, щоб зробити R доступним для більш загальної дослідницької аудиторії. Деякі з моїх роздумів (і злий хакер для ezANOVA) є на веб- сайті http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Було б цікаво почути всі думки!