Різниця між d Коена і хеджами для показників розміру ефекту


19

Для аналізу розміру ефекту зауважую, що існують відмінності між d Коена, Hedges's g і Hedges 'g *.

  • Ці три показники зазвичай дуже схожі?
  • Що було б у випадку, коли вони давали б різні результати?
  • Також це питання переваги, яким я користуюся чи повідомляю?

1
У випадку, якщо це корисно для потенційного відповіді, формули перераховані тут: en.wikipedia.org/wiki/Effect_size
Джеромі Англім

Моделювання в R із різними n1, n2, s1, s2 та різницею у сукупності зробило б хорошу вправу. Хтось?
Джеромі Англім

1
Цей матеріал також висвітлюється тут: Яка різниця між Hedges 'g та Cohen's d .
gung - Відновіть Моніку

Відповіді:


18

Варіанти d та хеджів Коена g та хеджів при допущенні рівних варіацій сукупності, але g пули, що використовують n - 1 для кожного зразка замість n, що забезпечує кращу оцінку, особливо менші розміри вибірки. І d, і g дещо позитивно зміщені, але лише незначно для помірних чи більших розмірів вибірки. Зміщення зменшується за допомогою g *. D by Glass не передбачає рівних дисперсій, тому він використовує sd контрольної групи або групу порівняння базової лінії як стандартизатор різниці між двома засобами.

Ці розміри ефектів та розміри Кліффа та інші непараметричні ефекти детально обговорюються в моїй книзі:

Grissom, RJ, & Kim, J, J. (2005). Розмір ефектів для дослідження: широкий практичний підхід. Mahwah, NJ: Ерльбаум.


8

Наскільки я розумію, g-то Hedges є дещо точнішою версією d Коена (з об'єднаною SD), оскільки ми додаємо поправочний коефіцієнт для невеликої вибірки. Обидва заходи, як правило, погоджуються, коли припущення гомоседастичності не порушено, але ми можемо знайти ситуації, коли це не так, див., Наприклад, McGrath & Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Інші папери перераховані в кінці моєї відповіді.

Я, як правило, виявив, що майже в усіх психологічних або біомедичних дослідженнях повідомляється про те, що йдеться про Коена; це, мабуть, випливає з добре відомого правила інтерпретації його величини (Cohen, 1988). Я не знаю про жодний останній документ, що розглядає g-то Хеджеса (або дельту Кліффа як непараметричну альтернативу). Брюс Томпсон має переглянуту версію розділу APA щодо розміру ефекту.

Подивившись про дослідження Монте-Карло щодо заходів щодо розміру ефекту, я виявив цей документ, що може бути цікавим (я читаю лише конспект та налаштування моделювання): Міцні інтервали довіри для розмірів ефектів: порівняльне дослідження кодексу Коена та дельти Кліффа під ненормальністю та гетерогенні варіації (pdf).

Щодо вашого другого коментаря, MBESSпакет R включає різні утиліти для обчислення ES (наприклад, smdта пов'язані з ними функції).

Інші посилання

  1. Закзаніс, К. К. (2001). Статистика, щоб сказати правду, всю правду, і нічого, крім істини: Формули, ілюстративні чисельні приклади та евристична інтерпретація аналізу розмірів ефекту для нейропсихологічних дослідників. Архів клінічної нейропсихології , 16 (7), 653-667. ( pdf )
  2. Дурлак, JA (2009). Як вибрати, обчислити та інтерпретувати розміри ефектів. Журнал дитячої психології ( pdf )

2
Анонімний користувач хотів додати наступне визначення гомоскедастичності для тих, хто може бути незнайомим з терміном: "властивість набору випадкових змінних, де кожна змінна має однакову кінцеву дисперсію".
gung - Відновити Моніку

5

Здається, коли люди кажуть, що Коен, вони переважно мають на увазі:

d=x¯1x¯2s

Де - об'єднане стандартне відхилення,s

с=(х1-х¯1)2+(х2-х¯2)2н1+н2-2

Існують й інші оцінки для об'єднаного стандартного відхилення, ймовірно, найпоширеніші, крім вищезазначених:

с=(х1-х¯1)2+(х2-х¯2)2н1+н2

Позначення тут надзвичайно непослідовні, але іноді люди кажуть, що версія (тобто версія ) називається Коена , і зарезервує ім'я Hedge's для версії, яка використовує (тобто з виправленням Бесселя, версія n1 + n2−2). Це дещо дивно, оскільки Коен окреслив обидва оцінки для об'єднаного стандартного відхилення (наприклад, версія на с. 67, Коен, 1977), перш ніж Хеджес писав про них (Hedges, 1981).сн1+н2ггсс

В інших випадках g-хедж зарезервований, щоб посилатися на будь-яку з виправлених зміщенням версій стандартизованої середньої різниці, яку розробляли Хеджи. Хедж (1981) показав, що d Коена був упередженим вгору (тобто його очікуване значення вище, ніж справжнє значення параметру популяції), особливо в невеликих зразках, і запропонував коригуючий коефіцієнт, щоб виправити зміщення d Коена:

Hedges's g (неупереджений оцінювач):

г=г(Γ(гf/2)гf/2Γ((гf-1)/2))
де для дизайн незалежних груп, а - це гамма-функція. (Спочатку Hedges 1981, ця версія розроблена з Hedges and Olkin 1985, p. 104)гf=н1+н2-2Γ

Однак цей поправочний коефіцієнт є досить обчислювально складним, тому Хедж також надав обчислювально тривіальне наближення, яке, хоч і є незначно упередженим, добре для майже всіх можливих цілей:

Хеджування ' (обчислювально тривіальне наближення):г

г=г(1-34(гf)-1)
Де для проектування незалежних груп.гf=н1+н2-2

(Спочатку від Hedges, 1981, ця версія від Borenstein, Hedges, Higgins, & Rothstein, 2011, стор. 27)

гг

н>20

Список літератури:

Боренштейн, М., Хеджес, Л. В., Хіггінс, Дж. П. та Ротштайн, HR (2011). Вступ до метааналізу. Західний Сассекс, Великобританія: John Wiley & Sons.

Коен, Дж. (1977). Статистичний аналіз потужності для поведінкових наук (2-е видання). Хіллсдейл, Нью-Джерсі, США: Lawrence Erlbaum Associates, Inc.

Хедж, LV (1981). Теорія розподілу для оцінювача скла за розміром ефекту та пов'язаних з ним оцінювачів. Журнал статистики освіти, 6 (2), 107-128. doi: 10.3102 / 10769986006002107

Хедж Л. В., Олкін І. (1985). Статистичні методи метааналізу. Сан-Дієго, Каліфорнія: Академічна преса


3

Якщо ви просто намагаєтесь зрозуміти основний сенс gedges ', як я, ви також можете скористатися цим:

Величину g хеджів можна інтерпретувати, використовуючи конвенцію Коена (1988 [2]) як малу (0,2), середню (0,5) та велику (0,8). [1]

Їх визначення коротке і чітке:

Hedges 'g - це зміна d Коена, яка виправляє зміщення за рахунок невеликих розмірів вибірки (Hedges & Olkin, 1985). [1] виноска

Я вдячний експертам статистики, що редагують це питання, щоб додати будь-які важливі застереження до невеликої (0,2) середньої (0,5) та великої (0,8) претензії, щоб допомогти непрофесійним уникнути помилкового тлумачення чисел Hedges, що використовуються в дослідженнях суспільних наук та психології.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Вплив терапії, що базується на усвідомленні, на тривогу та депресію: метааналітичний огляд Стефана Г. Гофмана, Еліс Т. Сойєр, Ешлі А. Вітт та Діана О. J Consult Clin Psychol. Квітень 2010 р .; 78 (2): 169–183. doi: 10.1037 / a0018555

[2] Коен Дж. Статистичний аналіз потужності для поведінкових наук. 2-е вид. Ерльбаум; Hillsdale, NJ: 1988 (цитується в [1])


4
+1. Re: маленький-середній-великий, як 1-й прохід, якщо у вас немає відповідних знань чи контексту, ці "розміри футболок" добре, але насправді, який невеликий чи великий ефект буде залежати від дисципліни чи теми . Більше того, те, що ефект "великий", не означає, що він практично важливий або теоретично значущий.
gung - Відновіть Моніку

1

Інші плакати висвітлювали питання подібності та відмінностей між g та d. На додаток до цього, деякі вчені вважають, що значення розміру ефекту, запропоновані Коеном, є занадто щедрими, що призводить до надмірного тлумачення слабких ефектів. Вони також не прив’язані до r, що призводить до можливості науковців можуть конвертувати вперед і назад, щоб отримати більш сприятливі для інтерпретації розміри ефектів. Фергюсон (2009, Professional Psychology: Research and PRactice) запропонував використовувати для інтерпретації g такі значення:

.41, як рекомендований мінімум для "практичного значення". 1,15, помірний ефект 2,70, сильний ефект

Це, очевидно, більш жорсткі / важкі для досягнення, і не багато експериментів з суспільствознавства мають досягти сильних наслідків ... що, мабуть, так і має бути.


0

Брюс Томпсон попереджав про використання Коена (0,2) як малого (0,5) як середнього та (0,8) як великого. Коен ніколи не мав на меті використовувати їх як жорсткі інтерпретації. Усі розміри ефектів повинні інтерпретуватися виходячи з контексту відповідної літератури. Якщо ви аналізуєте пов’язані з вами теми розміри ефектів, вони становлять (0,1) (0,3) (0,24), і ви створюєте ефект (0,4), то це може бути "великим". І навпаки, якщо вся супутня література має наслідки (0,5) (0,6) (0,7), а у вас ефект (0,4), це може вважатися невеликим. Я знаю, що це тривіальний приклад, але вкрай важливий. Я вважаю, що Томпсон одного разу заявив у статті, "Ми просто були б дурними в іншій метриці", порівнюючи трактування розмірів ефектів з тим, як соціалісти в той час інтерпретували значення p.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.