Як інтерпретувати та повідомляти ета-квадрат / частковий ета-квадрат у статистично значущих та несуттєвих аналізах?


39

У мене є дані, у яких значення ета-квадратів та часткові ета-квадратні значення обчислюються як міра розміру ефекту для середньогрупових різниць.

  • Яка різниця між ета-квадратом і частковою ета-квадратом? Чи можна їх обох інтерпретувати, використовуючи ті самі керівні принципи Коена (я вважаю, що 1988: 0,01 = малий, 0,06 = середній, 0,13 = великий)?

  • Також, чи є використання в розмірі ефекту звітування, якщо порівняльний тест (тобто t-тест або одностороння ANOVA) є незначним? У моїй голові це як би сказати, "середня різниця не досягла статистичної значущості, але все ще має особливу увагу, оскільки розмір ефекту, зазначений у етапі, є середнім". Або, чи розмір ефекту є заміною значення для перевірки значущості, а не доповнення?


Фактично SPSS обчислює частковий квадрат квадрата для всіх ANOVA. Це дасть те саме значення, що і етапи у квадратику в окремих IV незалежних групах, але інше значення в одиночних IV повторних проектах заходів. Це не спричиняє проблем з моїми учнями.

Відповіді:


43

Розміри ефектів для середніх груп різниць

  • Загалом, я вважаю, що стандартизовані різниці серед груп (наприклад, d Коена) є більш значущим показником розміру ефекту в контексті групових відмінностей. На такі заходи, як ета-квадрат, впливає, чи рівні розміри зразків груп, тоді як d Коена - ні. Я також думаю, що сенс заходів, заснованих на d, більш інтуїтивний, коли те, що ви намагаєтеся кількісно оцінити, - це різниця між груповими засобами.
  • Вищезазначений момент особливо сильний у випадку, коли у вас є лише дві групи (наприклад, ефект від лікування проти контролю). Якщо у вас більше двох груп, то ситуація трохи складніша. Я можу побачити аргумент щодо пояснення заходів, що пояснюються у цьому випадку. Як варіант, Коенаf2 - інший варіант.
  • Третій варіант полягає в тому, що в контексті експериментальних ефектів, навіть коли існує більше двох груп, концепція ефекту найкраще концептуалізується як бінарне порівняння (тобто ефект однієї умови відносно іншої). У цьому випадку ви можете знову повернутися до заходів на основі d. Вимір на основі d - це не міра розміру ефекту для фактору, а скоріше однієї групи відносно референтної групи. Ключовим є визначення значущої референтної групи.
  • Нарешті, важливо пам’ятати про більш широку мету включення заходів щодо розміру ефекту. Це дати читачеві відчути розмір ефекту, що цікавить. Будь-яка стандартизована міра ефекту повинна допомогти читачеві в цьому завданні. Якщо залежна змінна перебуває у значній шкалі, тоді не цурайтесь інтерпретувати розмір ефекту в рамках цієї шкали. Наприклад, такі масштаби, як час реакції, зарплата, зріст, вага тощо, по суті мають значення. Якщо ви вважаєте, як я це вважаю, ета в квадраті трохи неінтуїтивним в контексті експериментальних ефектів, можливо, виберіть інший індекс.

Ета у квадраті проти часткової етати у квадраті

  • Часткове ета-квадрат - це міра розміру ефекту за замовчуванням, про яку повідомляється в кількох процедурах ANOVA в SPSS. Я припускаю, що саме тому мені часто виникають питання з цього приводу.
  • Якщо у вас є лише одна змінна предиктора, то частковий ета-квадрат еквівалентний ета-квадрату.
  • Ця стаття пояснює різницю між ета-квадратом та частковим ета-квадратом (Левін і Халлетт. Ета-квадрат, Часткова ета-квадрат ).
  • Підсумовуючи це, якщо у вас є більше одного предиктора, частковий ета-квадрат - це відхилення, пояснене заданою змінною дисперсії, що залишилася після виключення дисперсії, поясненої іншими прогнокторами.

Правила великого пальця для квадрата етаги та часткового квадрата

  • Якщо у вас є лише один предиктор, то квадрат квадрата та частковий етаж будуть однаковими, і, таким чином, застосовуватимуться однакові правила.
  • Якщо у вас є більше одного передбачувача, то я думаю, що загальні правила великого пальця для ета-квадрата застосовуватимуться більше до часткового ета-квадрату, ніж до ета-квадрата. Це пояснюється тим, що часткова ета-квадратура у факторній ANOVA, напевно, більше наближає до того, що було б ета-квадратом для коефіцієнта, якби воно було одностороннім ANOVA; і, мабуть, це одностороння ANOVA, яка породила правила Коена. Загалом, включаючи інші фактори в експериментальну конструкцію, як правило, слід зменшити ета-квадрат, але не обов'язково частковий ета-квадрат через те, що другий фактор, якщо він має вплив, збільшує мінливість залежної змінної.
  • Незважаючи на те, що я кажу про правила великого пальця для квадратних етапів та часткових квадратиків, я повторюю, що я не шанувальник варіацій, пояснював міри ефекту розміру в контексті інтерпретації розміру та значення експериментальних ефектів. В рівній мірі правила великого простору є саме такими, грубими, залежними від контексту, і їх не слід сприймати занадто серйозно.

Розмір ефекту звітування в контексті значущих та несуттєвих результатів

  • У деякому сенсі метою вашого дослідження є оцінка різних кількісних оцінок ефектів ваших змінних, що цікавлять населення.
  • Розміри ефектів - це одне кількісне визначення точкової оцінки цього ефекту. Чим більший розмір вибірки, тим ближче, загалом, ваша оцінка вибіркової точки буде до справжнього ефекту сукупності.
  • В широкому розумінні тестування значимості має на меті виключити випадковість як пояснення ваших результатів. Таким чином, р-значення вказує вам на ймовірність дотримання розміру ефекту як або більш крайнього, якщо вважати, що нульова гіпотеза була правдивою.
  • Зрештою, ви хочете виключити ефект і хочете щось сказати про розмір справжнього ефекту населення. Інтервали довіри та інтервали довіри навколо розмірів ефекту - це два підходи, які безпосередньо стосуються цього питання. Однак звітність p-значень та точкових оцінок розміру ефекту є досить поширеною та набагато кращою, ніж звітування лише про p-значення або лише заходи щодо розміру ефекту.
  • Що стосується вашого конкретного запитання, якщо у вас є незначні результати, це рішення про те, чи повідомляєте ви про розміри ефекту. Я думаю, якщо у вас є таблиця з великою кількістю результатів, то має значення стовпець розміру ефекту, який використовується незалежно від значення. Навіть у несуттєвих контекстах розміри ефектів із довірчими інтервалами можуть бути інформативними щодо вказівки того, чи несуттєві результати можуть бути наслідком недостатнього розміру вибірки.

1
Привіт, Джеремі - я з вами відрізняюсь, коли ви говорите, що "частковий ета-квадратичний факторний ANOVA, можливо, більш детально наближає до того, що було б у квадратичного фактору, якби це була АНОВА в одну сторону". Насправді, ета-квадрат, якщо предиктор використовувався один, може бути набагато більшим, ніж його частковий ета-квадрат у компанії інших прогнокторів. В останньому випадку спільна дисперсія, пояснена в результаті, не зараховується до відповідного прогноктора; в першому не існує "конкуренції" за пояснену дисперсію, тому передбачувач отримує кредит за будь-яке перекриття, яке воно показує з результатом.
rolando2

3
@ rolando2 Можливо, мій погляд був неоднозначним. Я маю на увазі розроблені експерименти. Скажімо, експеримент 1 маніпулює фактором A, а експеримент 2 A і B. Припускаючи збалансовану конструкцію, обидва фактори є ортогональними. Якщо припустити, що обидва фактори пояснюють дисперсію, дисперсія, пояснена фактором А в експерименті 2, буде меншою, ніж в експерименті 1, де рівень фактора В підтримується постійним. Таким чином, порівнюючи факторні експерименти з однофакторними експериментами, я вважаю, що частковий ета-квадрат є більш схожим у факторних та однофакторних експериментах, особливо якщо немає ефекту взаємодії.
Джеромі Англім
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.