Яка описова статистика не є розмірами ефектів?


12

У Вікіпедії йдеться

розмір ефекту - це міра сили явища чи оцінка на основі вибірки цієї кількості. Розмір ефекту, обчислений на основі даних, є описовою статистикою, яка передає оцінену величину взаємозв'язку, не роблячи жодних тверджень про те, чи відображається очевидний зв'язок у даних справжніх стосунків у сукупності.

Щоб краще зрозуміти, мені було цікаво, що описова статистика не має розміру ефекту, крім графіків та графіків.


Графік та графіки можуть бути справді великими, щоб оцінити розмір ефекту більш інтуїтивно зрозумілими способами, ніж розмір ефекту. Якщо ви дійсно бачите збіг між двома групами щодо деяких заходів (що б приблизно відповідало меншим d ), можливо, простіше зрозуміти, що значна різниця не означає, що всі члени однієї групи мають нижчі бали, ніж члени іншої групи і т. д.
Гала

Відповіді:


18

Ефекти розмірів

  • Загальні стандартизовані розміри ефекту зазвичай кількісно визначають кількість або ступінь взаємозв'язку чи ефекту. Найбільш розповсюджені розміри ефектів - це, мабуть, d Коена, Пірсона r та коефіцієнт шансів (особливо для двійкового прогноктора).
  • Менш поширені заходи щодо розміру ефекту:З огляду на це, можна застосовувати стандартизовані та нестандартні заходи щодо розміру ефекту. Будь-яка статистика, яка повідомляє ступінь взаємозв'язку і не особливо забруднена розміром вибірки, ймовірно, є мірою ефекту. Таким чином, бета-коефіцієнти, R-квадрат, коваріація, середні значення різниці між групами і так далі фіксують ступінь ефекту. Зважаючи на це, я вважаю, що деякі дослідники застосовують заходи щодо розміру ефекту дещо наосліп і забувають, що більш широка мета полягає в тому, щоб дати читачам відчуття ступеня ефекту. Таким чином, вони часто не усвідомлюють, що такі заходи, як середні різниці або коефіцієнти регресії, є певним чином мірою розміру ефекту. Інший приклад сліпого використання розмірів ефектів передбачає використання заходів щодо розміру ефекту, які не мають інтуїтивного тлумачення, але були рекомендовані деяким підручником.

Розміри без ефекту:

  • Більшість тестових статистичних даних не мають ефектів. Наприклад, тест на Chi-квадрат, t-тест, z-тест, F-тест. Вони збільшуються як із збільшенням чисельності ефекту популяції, так і зі збільшенням кількості вибірки. Багато в чому в останні роки наголошувалося на цілій мові розмірів ефектів, оскільки дослідники занадто велику увагу приділяли тому, наскільки великими були їхні статистичні дані, а не наскільки великі їх розміри ефектів. Це особливо важливо, коли у вас великий розмір вибірки, коли навіть невеликі ефекти можуть бути статистично значущими.
  • Більшість одноманітних статистичних даних не мають розмірів ефектів. Для більшості цілей розмір ефекту викликає залежність між принаймні двома змінними. Таким чином, середнє значення для вибірки, стандартне відхилення, перекос, куртоз, хв, макс. Тощо не є мірою розміру ефекту.
  • Статистика, що не стосується ступеня взаємозв'язку , не є мірою розміру ефекту. Наприклад, тести на багатоваріантну нормальність, власні значення матриці тощо, як правило, безпосередньо не спрямовані на кількісну оцінку ефекту у звичайному розумінні цього слова.

Ширші міркування

  • Міркування щодо масштабування: Корисність статистики як міри розміру ефекту багато в чому пов'язана з її здатністю повідомляти розмір ефекту. Іноді це досягається за допомогою звичних стандартизованих заходів ефекту (наприклад, Коена d). В іншому випадку ретельний розгляд масштабування змінних може дати ще більш чітку інтерпретацію розміру ефекту. Наприклад, скажіть, у мене було дослідження, яке вивчало навчальну програму щодо рівня доходів. Я можу повідомити, що програма навчання збільшила дохід на .2 стандартних відхилення або могла сказати, що програма збільшила дохід на 3500 доларів США. Обидва корисні; і те й інше - це розмір ефекту. Перший є стандартизованим (d) Коена, другий - нестандартним (середні групи значень різниці).
  • Точність в оцінці розмірів ефекту: ми часто дістаємо зразкові оцінки мір розміру ефекту (наприклад, d Коена, r, пірсона тощо). Цей контекст може призвести до протиставлення значущості тестуванню мірам розміру ефекту. Тим не менше, мета все ж повинна бути точно та неупереджено оцінити розмір ефекту від населення. З періодичної точки зору, довірчі інтервали навколо розмірів ефекту забезпечують точність оцінки. З байєсівської точки зору, спостерігаються задні щільності за розмірами ефекту. У багатьох випадках потрібно бути обережним, щоб ви використовували неупереджений розмір ефекту.

1
(+1) Приємна відповідь.
chl

Третій та останній пункти, ймовірно, пояснюють, звідки походить автор (и) статті Вікіпедії. Зважаючи на акцент на психології, я думаю, що справа не стільки в тому, щоб протиставити розмір ефекту з іншими описовими статистичними даними, а скоріше зі статистикою тестів та p-значеннями (тобто інфекційною статистикою), а також підкреслити, що заходи щодо розміру ефекту нічого не говорять про мінливість вибірки.
Гала

Велике спасибі за вашу приємну відповідь. Однак у мене виникає питання: чи означає ви, що довірчий інтервал не може використовуватися як міра розміру ефекту, оскільки він безпосередньо пов'язаний з розміром вибірки? (під довірчим інтервалом я маю на увазі значення, яке додається або віднімається від поширеності, середнього значення і т. д. - не верхня і нижня межі CI).
Вік

2
@Vic ви можете мати довірчий інтервал щодо вимірювання розміру ефекту, але сам довірчий інтервал не є розміром ефекту.
Джеромі Англім

Щиро дякую, дорогий Єромі. За всі ці роки я помилявся. :)
Вік

6

По-перше, розміри ефектів можуть використовуватися як інфекційно, так і описово. r та АБО - всі розміри ефектів і, безумовно, всі використовуються в статистиці інфекцій.

Уніваріатна статистика зазвичай не має ефектів, хоча вони можуть бути. Наприклад, якщо ви порівнюєте віки чоловіків і жінок, які одружуються один з одним, середній вік чоловіків не є розміром ефекту (тоді різниця засобів буде одним розміром ефекту). Але якщо ви хочете побачити, чи є середнє значення чогось 0, то це буде розмір ефекту.

Якщо він вимірює ефект, це розмір ефекту!


Я думаю, що це правда @Peter, але розмір ефекту - це термін, який був більш вузько визначений Коеном: (Mean1-Mean2) / PooledSD. Це трохи схоже на те, що різниця суттєва або лише статистично значуща - використання загальних слів для визначення статистичного терміна.
подв.номери

2
Де Коен визначає це так? Якщо ви маєте на увазі його книгу про Аналіз потужності, я думаю, що він використовує це в якості стандарту для перетворення інших розмірів ефектів в. Але кожна таблиця аналізу потужності в цій книзі (а є багато) використовує певний розмір ефекту (і не всі використовують цей)
Пітер Флом - Відновити Моніку

1
Коли Коена - це завжди так, як я це зрозумів. Аналогічно описаному en.wikipedia.org/wiki/Effect_size . Але ви абсолютно праві, існує маса методів, описаних як розмір ефекту.
подв.номери

4
T-тест і z-тест не є ефектами розмірів. однаковий розмір ефекту дасть істотно різні значення t і z для різних розмірів вибірки.
Джеромі Англім

1
@JeromyAnglim має рацію; +1. Я відредагував свою відповідь
Пітер Флом - Відновіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.