Чи слід включати аргумент, щоб запитувати суми квадратів III типу у ezANOVA?


16

Я розробив пакет ez для R як засіб, який допомагає людям переходити від пакетів статистики, таких як SPSS до R. Це досягається (сподіваємось) шляхом спрощення специфікації різних ароматів ANOVA та надання SPSS-подібного виходу (включаючи розміри ефекту та припущення тести), серед інших особливостей. Ця ezANOVA()функція здебільшого виконує функції обгортки car::Anova(), але поточна версія ezANOVA()реалізує лише суми квадратів типу II, тоді як car::Anova()дозволяє уточнити суми квадратів II або II типу. Як я, можливо, міг очікувати, кілька користувачів просили я надати аргумент вezANOVA()що дозволяє запиту користувача типу II або III-типу. Я не зважався на це і виклав свої міркування нижче, але я вдячний для участі громади в моїх чи будь-яких інших міркуваннях, що стосуються цього питання.

Причини не включати аргумент "SS_type" у ezANOVA():

  1. Різниця між квадратами суми I, II та III збільшиться лише тоді, коли дані не врівноважені, і в цьому випадку я б сказав, що більша користь отримана від покращення дисбалансу шляхом подальшого збору даних, ніж спільної роботи з обчисленням ANOVA.
  2. Різниця між II та III типом стосується ефектів нижчого порядку, які кваліфікуються ефектами вищого порядку, і в цьому випадку я вважаю ефекти нижчого порядку науково нецікавими. (Але див. Нижче про можливе ускладнення аргументу)
  3. У тих рідкісних обставинах, коли (1) і (2) не застосовуються (коли подальший збір даних неможливий і дослідник має вагомий науковий інтерес до кваліфікованого основного ефекту, який я зараз не уявляю), можна порівняно легко змінити ezANOVA()джерело або наймають car::Anova()себе для досягнення типу III випробувань. Таким чином я бачу додаткові зусилля / розуміння, необхідні для отримання випробувань III типу як засобу, за допомогою якого я можу забезпечити, щоб цим шляхом йшли лише ті, хто дійсно знає, що вони роблять.

Тепер самий останній запитувач III типу зазначив, що аргумент (2) підірваний при розгляді обставин, коли існуючі, але "несуттєві" ефекти вищого порядку можуть зміщувати обчислення сум квадратів для ефектів нижчого порядку. У таких випадках можна уявити, що дослідник звернеться до ефекту вищого порядку, і побачивши, що це "несуттєво", зверніться до спроби тлумачення ефектів нижчого порядку, які, невідомі досліднику, були піддані компрометації. Моя початкова реакція полягає в тому, що це не проблема з сумами квадратів, а з р-значеннями і традицією тестування нульової гіпотези. Я підозрюю, що більш явна міра доказів, така як коефіцієнт ймовірності, може бути більшою ймовірністю створити менш неоднозначну картину моделей, що підтримуються, узгоджуючись з даними. Однак у мене немає


2
Незабаром - так. Просто дозволити узгодженість з іншими пакетами (навіть якщо результат якимось чином був "неправильним" - у такому випадку попереджувальний масаж буде нормальним). І дякую за ваш дивовижний пакет!
Тал Галілі

Коли я писав "пакунки", я мав на увазі інші статистичні пакети (наприклад, SPSS та SAS) - я радий, що інші довели справу додому, ніж я :)
Тал Галілі

2
Як багато хто вже знає, поточний пакет ez (версія 3) оновив ezANOVA, який має аргументи для SS Type та моделі aov return.
jiggysoo

Відповіді:


9

Просто для посилення - я вважаю, що я останній запитувач.

У конкретному коментарі до пунктів Майка:

  1. Цілком вірно, що різниця I / II / III застосовується лише з корельованими прогнозами (з яких незбалансовані конструкції є найпоширенішим прикладом, безумовно, у факторних ANOVA) - але це, як мені здається, є аргументом, який відхиляє аналіз неврівноваженої ситуації (а отже, будь-які дебати типу I / II / III). Це може бути недосконалим, але саме так і відбувається (і в багатьох контекстах витрати на подальший збір даних переважають над статистичною проблемою, незважаючи на це).

  2. Це цілком справедливо і являє собою м'ясо більшості аргументів "II проти III, надаючи перевагу II", які я натрапив. Найкращий підсумок, з яким я стикався, - це Лангсруд (2003) "ANOVA для незбалансованих даних: Використовуйте тип II замість сум III типів", "Статистика та обчислення" 13: 163-167 (у мене є PDF, якщо оригінал важко знайти ). Він стверджує (беручи до уваги двофакторний випадок як основний приклад), що якщо є взаємодія, то існує взаємодія, тому розгляд основних ефектів зазвичай безглуздий (очевидно, справедливий момент) - а якщо взаємодії немає, аналіз типу II Основні ефекти є більш потужними, ніж тип III (безсумнівно), тому завжди слід переходити з типом II. Я бачив інші аргументи (наприклад, Venables,

  3. І я згоден з цим: якщо у вас є взаємодія, але у вас є питання щодо головного ефекту, то ви, мабуть, перебуваєте на території робити самі.

Зрозуміло, що є ті, хто просто хоче типу III, оскільки це робить SPSS, або якесь інше посилання на статистичні вищі органи. Я не повністю проти цієї точки зору, якщо справа зводиться до вибору багатьох людей, які дотримуються SPSS (проти чого я маю деякі речі, а саме час, гроші та умови закінчення терміну дії ліцензії) та тип III SS, або багато люди, які переходять на R і III тип СС. Однак цей аргумент явно є кульгавим статистично.

Однак аргумент, який я виявив досить вагомим на користь типу III, - це аргумент, зроблений незалежно Myers & Well (2003, "Науково-дослідний дизайн та статистичний аналіз", с. 323, 626-629) та Maxwell & Delaney (2004, " Проектування експериментів та аналіз даних: перспектива порівняння моделі ", с. 324-328, 332-335). Це так:

  • якщо є взаємодія, всі методи дають однаковий результат для суми взаємодії квадратів
  • Тип II передбачає відсутність взаємодії для перевірки основних ефектів; тип III не відповідає
  • Деякі (наприклад, Лангсруд) стверджують, що якщо взаємодія не є істотною, ви обгрунтовуєте припущення, що такого немає, і дивлячись на (більш потужні) основні ефекти типу II
  • Але якщо тест на взаємодію недостатній, все-таки існує взаємодія, взаємодія може вийти «незначною», але все-таки призведе до порушення припущень тесту на основні ефекти типу II, зміна цих тестів буде занадто ліберальною. .
  • Майєрс і Ну цитують Аппельбаума / Креймера як основних прихильників підходу типу II, і продовжуємо [p323]: "... Можна використовувати більш консервативні критерії несуттєвості взаємодії, наприклад, вимагаючи, щоб взаємодія не була суттєвою при рівень .25, але недостатньо розуміння наслідків навіть такого підходу. Як правило, суми квадратів II типу не повинні обчислюватися, якщо тільки не існує вагомих апріорних причин вважати відсутність ефектів взаємодії та явно несуттєва взаємодія сума квадратів ". Вони цитують [p629] В цілому Lee & Hornick 1981 як демонстрація того, що взаємодії, які не наближаються до значущості, можуть зміщувати тести основних ефектів. Maxwell & Delaney [p334] виступають за підхід типу II, якщо взаємодія населення дорівнює нулю, і підхід типу III, якщо він не є [для інтерпретації засобів, похідних від цього підходу]. Вони занадто виступають за використання типу III у реальній ситуації (коли ви робите висновки про наявність взаємодії з даних) через проблему зробити помилку [2, що недостатньо працює] в тесті взаємодії і, таким чином, випадково порушити припущення щодо типу підходу типу II; Потім вони роблять подібні додаткові моменти до Myers & Well і відзначають довгі дискусії з цього питання! повторний висновок про наявність взаємодії з даних) через проблему помилки в тесті взаємодії типу 2 [тим, що недостатньо], і, таким чином, випадково порушивши припущення підходу SS II типу; Потім вони роблять подібні додаткові моменти до Myers & Well і відзначають довгі дискусії з цього питання! повторний висновок про наявність взаємодії з даних) через проблему помилки в тесті взаємодії типу 2 [тим, що недостатньо], і, таким чином, випадково порушивши припущення підходу SS II типу; Потім вони роблять подібні додаткові моменти до Myers & Well і відзначають довгі дискусії з цього питання!

Отже, моє тлумачення (і я не експерт!) Полягає в тому, що в обох сторонах аргументу є достатньо Вищого статистичного органу; що звичайні аргументи висловлюються не про звичайну ситуацію, яка б породжувала проблеми (ця ситуація є звичайною інтерпретацією основних ефектів при несуттєвій взаємодії); і що є справедливі причини бути занепокоєними щодо підходу типу II у цій ситуації (і це зводиться до влади проти потенціалу надлібералізму).

Для мене цього достатньо, щоб побажати варіанту типу III в ezANOVA, а також типу II, тому що (за мої гроші) це чудовий інтерфейс до ANOVA-систем R. На мій погляд, R є певним способом від простоти у використанні для новачків, і пакет "ez" із ezANOVA та досить чудовим функцією побудови ефекту проходить довгий шлях до того, щоб зробити R доступним для більш загальної дослідницької аудиторії. Деякі з моїх роздумів (і злий хакер для ezANOVA) є на веб- сайті http://www.psychol.cam.ac.uk/statistics/R/anova.html .

Було б цікаво почути всі думки!


Ах, я не розумів, що розрізнення типу II / III виникає всякий раз, коли прогнози співвідносяться, з яких незбалансований дизайн - лише один приклад. Це, безумовно, ще більше підриває мій перший аргумент "просто зібрати більше даних".
Майк Лоуренс

2
Я швидше переконаний у вашому аргументі, що R отримає більше перетворень SPSS, якщо їм забезпечити прості засоби для отримання знайомих аналізів, навіть якщо ці аналізи потребують більш детального розгляду, ніж зазвичай застосовується. Потім, як тільки ми зачепимо їх на R, ми можемо спробувати переконати їх у тому, що знайомий підхід не завжди є відповідним підходом. Я думаю, що я все-таки поставлю за замовчуванням як type = 2 з великим попередженням у документації, що цей замовчувач може дати результати, які відрізняються від SPSS та посилань, документацію щодо відмінності II / III.
Майк Лоуренс

Інші зміни на корельованих предикторах, як правило, мають суцільні прогнози, але так, це загальна проблема. // Це мені чудово звучить! Іноді ці зрушення повільні; використання корекцій сферичності (а не ігнорування проблеми) - це, на мій погляд, досягнутий прогрес у нейрознавстві. Були випадки, коли будь-яка згадка про це (особливо якщо ви повідомляли про виправлене, не ціле число df) змушував арбітрів думати, що ви гавкаєте.
Рудольф Кардинал

Я хотів би додати, що аргументи типу III стосуються тестів на консервативну або ліберальну гіпотезу, але не про значення компонентів. Основний ефект типу III просто не є розумним, оскільки він включає взаємодію з відсутніми основними ефектами. Незалежно від питань консервативного чи ліберального тестування, основний узгодженість моделі вимагає типу II, оскільки головний ефект типу II має сенс. Зважаючи на це, ezANOVA повинен мати тип III з інших причин.
Іван

7

Caveat: суто нестатистична відповідь. Я вважаю за краще працювати з однією функцією (або хоча б з одним пакетом), коли роблю аналогічні типи аналізу (наприклад, ANOVA). До сих пір я послідовно використовую, Anova()оскільки віддаю перевагу його синтаксису для вказівки моделей з повторними заходами - порівняно з aov()та втрачаю мало (SS типу I) при повторних заходах. ezANOVA()приємно за додаткову перевагу розмірів ефектів. Але те, що мені особливо не подобається, - це мати справу з трьома різними функціями, щоб зробити по суті один і той же тип аналізу, тільки тому, що одна з них реалізує функцію X (але не Y), а інша Y (але не X).

Для ANOVA, я можу вибрати між oneway(), lm(), aov(), Anova(),ezANOVA() , і , можливо , інші. Викладаючи R, це вже болісно пояснювати різні варіанти, як вони співвідносяться один з одним ( aov()це обгортка lm()) і яка функція виконує що:

  • oneway() тільки для однофакторних конструкцій, але з опцією var.equal=FALSE . Немає такої опції у aov()та інших, але ці функції також для багатофакторних конструкцій.
  • синтаксис для повторних заходів трохи складніший aov(), краще вAnova()
  • зручний SS тип I тільки в aov() , а не вAnova()
  • зручні СС типу II і III тільки в Anova() , а не вaov()
  • зручний розмір ефекту в ezANOVA() не в інших

Було б акуратно тільки вчити одній функції з одним послідовним синтаксисом, який робить це все. Без зручного SS типу III ezANOVA()для мене це не може бути, тому що я знаю, що студентам буде запропоновано їх використовувати в якийсь момент ("просто перевірте ці результати, отримані Джоном Доу з SPSS"). Я вважаю, що краще мати вибір, щоб зробити вибір самостійно, не вивчаючи ще один синтаксис для конкретизації моделей. Ставлення "Я знаю, що для тебе найкраще" може мати свої достоїнства, але може бути надмірно захисним.


1
Щоб додати ще одну вимогу: Було б абсолютно приголомшливо, якби функція також змогла запускати всі види контрастів з цієї ANOVA, наприклад, використовуючи multcompпакет (який, наскільки я пам'ятаю, вимагає aovоб'єктів). Інакше я погоджуюся повністю і зазвичай використовую ezдля свого щоденного обов'язку, тому що це так просто ...
Генрік

1
додавання аргументу "метод" (з можливими значеннями, як "oneway", "aov" і "Anova", і з аргументом "..." для передачі var.eq = FALSE в один бік і типу = 2 для Anova) є інтригуюча ідея, і, безумовно, здається, що включити її було б досить просто. Дякую за пропозицію.
Майк Лоуренс

@Henrik: Я маю чесно сказати, що моє розуміння контрастів дуже обмежене, і я ніколи не використовую їх у своїх дослідженнях, тому я не визначив пріоритетного включення контрастів у ez.
Майк Лоуренс

@Mike Якщо ви можете додати аргумент методу, і так ваша функція зможе повернути aovелемент, який був би чудовим. Поки я зазвичай лінуюся зробити свій власний aovелемент і використовувати вас ezANOVAзамість т. Тестів ...
Генрік

@Mike Я не наважувався запропонувати щось подібне, оскільки це ваша робота, яку ви вкладаєте. Дякую за це! У ezпакета є великий потенціал: в психології він вже рекомендується досить часто (пор. Німецька книга "R für Einsteiger" Луманна). Зробити це ще більш гнучким, безумовно, буде вдячний.
каракал

2

Світ R дуже не любить Type 3 SS.

Однією з часто цитованих посилань є "Екзегези на лінійних моделях" Білла Венаблеса (2000) .

Я сподіваюсь, що я його не зловживаю, але я думаю, що його головний аргумент полягає в тому, що тип 3 SS порушує принцип маргінальності лінійних моделей і тому не є розумним.


0

Це була для мене очейною дискусією щодо питання типу II / III. Дякуємо за всі зусилля у наданні дискусії. Я б підійшов до думки про те, щоб послідовно рекламувати тип II над типом III, але я мало розумівся на цьому аргументі - я просто покладався на поради в регресійній книзі Джона Фокса (автомобіль), яка рекомендувала рідко проводити випробування типу III інтерпретаційне (ну, я думаю, що він це сказав ...).

Так чи інакше, ezANOVA дуже корисна для дозволу на доступ до функціональних можливостей R, що інакше було б неможливо для студентів, які я викладаю з психології. Я надаю онлайн-модулі R, один із яких містить ezANOVA для демонстрації змішаних конструкцій ANOVA (хоча, здається, попередня версія 3, можливо, була помилкою для цього ... так!)

Спробуйте тут:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

після завантаження модуля (~ 10 с) знайдіть кнопку обчислення (наполовину сторінки вниз), і вона запустить ezANOVA та пов'язані з ними таблиці та графіки.

Ян


Коли ви говорите, що ez баггі для змішаних конструкцій ANOVA, ви базуєте це на моєму недавньому оголошенні версії 3.0, в якому зазначаю, що в коді ezMixed () була помилка? Якщо так, я думаю, що ви неправильно трактували цю замітку. ezMixed () не пов’язаний із ezANOVA (). ezMixed () служить для допомоги в оцінці впливу фіксованих ефектів у контексті моделювання змішаних ефектів.
Майк Лоуренс

ХІ Майк - ви цілком праві - це була ваша примітка на ezMixed (), я читав і неправильно тлумачив це для ezANOVA ().
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.