Чи вагома залежність від точності (тобто зворотної дисперсії) є невід'ємною частиною мета-аналізу?


10

Чи точне зважування є основним для мета-аналізу? Боренштейн та ін. (2009) пишуть, що для мета-аналізу можливим є все необхідне:

  1. Дослідження повідомляють про бальну оцінку, яка може бути виражена як одне число.
  2. Для цієї бальної оцінки може бути обчислена варіація.

Мені не відразу зрозуміло, чому (2) суворо необхідний. Дійсно, всі широко прийняті методи метааналізу покладаються на схеми зважування на основі точності (тобто оберненої дисперсії), які вимагають оцінки дисперсії для розміру ефекту кожного дослідження. Зауважимо, що, хоча метод Хеджеса (Хеджес та Олкін, 1985; Хедж і Вевеа, 1998) та метод Хантера і Шмідта (Hunter & Schmidt, 2004) в основному використовують зважування розмірів вибірки, ці методи застосовуються лише до нормалізованих середніх відмінностей, і тому вимагають стандартне відхилення в іншому місці. Має сенс, що ваги, обернено пропорційні дисперсії в кожному дослідженні, мінімізують відхилення в оцінці загального розміру ефекту, тож ця схема зважування є необхідною особливістю всіх методів?

Чи можливо провести систематичний огляд без доступу до дисперсії для кожного розміру ефекту і все-таки назвати результат метааналізом? Розмір вибірки може бути потенційним як проксі-сервер для точності, коли дисперсія недоступна. Можна, наприклад, використати зважування за розміром вибірки у дослідженні, де розмір ефекту визначався як середня різниця? Як це вплине на послідовність та ефективність отриманого середнього розміру ефекту?


гарне запитання. Якщо ви виділите чіткий конкретний запит, може допомогти читачеві.
Subhash C. Davar

Зокрема, я шукаю спосіб включити міру неоднорідності між дослідженнями (тобто випадковими ефектами) у мою схему зважування, коли дані про дисперсію доступні не для всіх досліджень. Більш ранню, більш конкретну версію мого питання можна знайти тут: stats.stackexchange.com/questions/155063/…
Дженніфер

Відповіді:


11

На це питання важко відповісти, оскільки воно настільки вказує на загальну плутанину і заплутане стан справ у більшості метааналітичної літератури (ОП тут не винен - ​​це література та опис методів , моделей і припущень, що часто буває безлад).

Але коротко кажучи: ні, якщо ви хочете поєднати купу оцінок (які кількісно оцінюють якийсь ефект, ступінь асоціації чи якийсь інший результат, який вважається релевантним), і ці сенси можна об'єднати, тоді ви могли просто взяти їх (не зважене) середнє, і це було б чудово. Нічого поганого в цьому і за тими моделями, які ми зазвичай припускаємо, коли ми проводимо метааналіз, це навіть дає вам неупереджену оцінку (припускаючи, що самі оцінки є неупередженими). Отже, ні, для комбінування оцінок не потрібні відхилення вибірки.

То чому взаємно-дисперсійне зважування майже є синонімом насправді мета-аналізу? Це пов'язано із загальною думкою про те, що ми надаємо більше достовірності великим дослідженням (з меншими відхиленнями вибірки), ніж меншим дослідженням (з більшими відхиленнями вибірки). Фактично, за припущеннями звичайних моделей, використання зворотного дисперсійного зважування призводить до рівномірно мінімальної дисперсійної неупередженої оцінки(UMVUE) - добре, начебто, знову ж таки, приймаючи неупереджені оцінки та ігноруючи той факт, що відхилення вибірки насправді часто точно не відомі, але самі оцінюються і в моделях з випадковими ефектами, ми також повинні оцінювати дисперсійний компонент за неоднорідністю, але тоді ми просто трактували це як відому константу, що теж не зовсім правильно ... але так, ми начебто отримуємо UMVUE, якщо використовуємо зворотну дисперсію, зважуючи, якщо просто сильно косимо очі і ігноруємо деякі з них питань.

Отже, тут поставлена ​​на карту ефективність оцінки, а не неупередженість. Але навіть невагомене середнє найчастіше не буде набагато менш ефективним, ніж використання середньозваженої середньозваженої середньої величини, особливо у моделях з випадковими ефектами та коли величина неоднорідності велика (у цьому випадку звичайна схема зважування призводить до майже рівномірних ваг все одно!). Але навіть у моделях з фіксованим ефектом або з малою неоднорідністю різниця часто не є переважною.

І як ви вже згадували, можна також легко розглянути інші схеми зважування, такі як зважування за розміром вибірки або деякою функцією, але знову ж таки це лише спроба отримати щось наближене до ваг зворотної дисперсії (оскільки відхилення вибірки - це значною мірою визначається розміром вибірки дослідження).

Але насправді можна взагалі «розв’язати» питання про ваги та відхилення. Вони справді є двома окремими творами, про які треба думати. Але це не так, як зазвичай представлені речі в літературі.

Однак справа тут у тому, що вам потрібно подумати над обома. Так, ви можете взяти незважене середнє значення як вашу комбіновану оцінку, і це, по суті, буде метааналізом, але як тільки ви захочете почати робити висновки на основі цієї комбінованої оцінки (наприклад, провести тест на гіпотезу, побудувати інтервал довіри ), вам потрібно знати відхилення вибірки (та кількість неоднорідності). Подумайте про це так: Якщо ви поєднаєте купу невеликих (і / або дуже неоднорідних) досліджень, ваша бальна оцінка буде набагато менш точною, ніж якщо ви об'єднаєте однакову кількість дуже великих (та / або однорідних) дослідження - незалежно від того, як ви зважили свої оцінки при розрахунку комбінованої вартості.

Насправді, навіть існують певні шляхи, коли ми не знаємо варіацій вибірки (та кількості неоднорідності), коли ми починаємо проводити інфекційну статистику. Можна розглядати методи, засновані на переустановці (наприклад, завантажувальне завантаження, перестановка перестановки) або методи, що дають послідовні стандартні помилки для комбінованої оцінки навіть тоді, коли ми неправильно визначаємо частини моделі - але наскільки добре ці підходи можуть працювати, потрібно ретельно оцінити на в кожному конкретному випадку.


0

Якщо ви знаєте деякі стандартні помилки, але не всі їх, ось таке рішення:

(1) припустимо, що невідомий SE виводиться випадковим чином з того ж розподілу, що і відомий SE, або нехай розподіл SE для оцінок паперів з невідомим SE є вільною змінною. Якщо ви хочете пофантазувати, ви можете використовувати усереднення моделей за цими параметрами.

(2) оцінка через максимальну ймовірність

Якщо ваше дослідження з невідомим SE є «чужим», модель пояснить аномалію комбінацією цих способів:

(a) дослідження, ймовірно, мало високий показник SE для своєї оцінки (дослідження, ймовірно, має низьку потужність)

(b) дослідження, ймовірно, має великий компонент випадкових ефектів (дослідник вибрав набір даних або метод тощо, що дає нетиповий результат)

Фактично, ця модель знизить ефективну точність оцінки з невідомим SE, оскільки вона стане більш аномальною. У цьому відношенні це дуже стійко до включення "випускників". У той же час, якщо ви додасте безліч досліджень з невідомою дисперсією, але з типовими результатами, SE або ваша остаточна оцінка впаде.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.