Чи пропонують співвідношення правдоподібності та порівняння моделі Байєса вищі та достатні альтернативи тестуванню гіпотез на нуль?


13

У відповідь на зростаючу групу статистиків та дослідників, які критикують корисність тестування гіпотез (NHT) для науки як сукупного зусилля, Американська спеціальна група психологічних асоціацій зі статистичних висновків уникала прямої заборони НТГ, але натомість запропонувала дослідникам повідомляти розміри ефекту на додаток до p-значень, отриманих від NHT.

Однак розміри ефектів не просто накопичуються в ході досліджень. Метааналітичні підходи можуть накопичувати розподіли розмірів ефектів, але розміри ефектів, як правило, обчислюються як співвідношення між величиною неочищеного ефекту та нез'ясованим "шумом" в даних даного експерименту, що означає, що на розподіл розмірів ефекту впливає не тільки мінливість в необробленій величині ефекту в ході досліджень, але також мінливість прояву шуму в ході досліджень.

На відміну від цього, альтернативний показник сили ефекту, коефіцієнти ймовірності дозволяють як інтуїтивно зрозуміти інтерпретацію на основі кожного окремого дослідження, так і може бути легко агрегований у ході досліджень для мета-аналізу. У межах кожного дослідження імовірність представляє вагомість доказів для моделі, що містить заданий ефект відносно моделі, яка не містить ефекту, і, як правило, може бути повідомлена як, наприклад, "Обчислення коефіцієнта ймовірності для ефекту X виявив у 8 разів більше доказів ефекту, ніж для відповідної нулі ". Крім того, коефіцієнт ймовірності також дозволяє інтуїтивно уявляти силу нульових значень, наскільки коефіцієнти ймовірності нижче 1 являють собою сценарії, коли нуль надає перевагу, а прийняття зворотного значення цього значення представляє вагомість доказів щодо нуля над ефектом. Помітно, коефіцієнт ймовірності представлений математично як співвідношення незрозумілих дисперсій двох моделей, які відрізняються лише дисперсією, поясненою ефектом, і, таким чином, не є величезним концептуальним відходом від розміру ефекту. З іншого боку, обчислення коефіцієнта метааналітичної вірогідності, що представляє вагомість доказів для ефекту в ході досліджень, є просто питанням отримання продукту коефіцієнтів ймовірності в дослідженнях.

Таким чином, я стверджую, що для науки, яка прагне встановити ступінь грубих доказів на користь ефекту / моделі, коефіцієнт вірогідності - це шлях.

Існують більш нюансовані випадки, коли моделі відрізняються лише від конкретного розміру ефекту, і в цьому випадку може бути бажаним якесь подання інтервалу, за який ми вважаємо, що дані відповідають значенню параметрів ефекту. Дійсно, робоча група APA також рекомендує звітувати про довірчі інтервали, які можна використовувати для цього, але я підозрюю, що це теж необдуманий підхід.

Інтервали довіри настільки часто неправильно трактуються ( як студенти, так і дослідники ). Я також побоююсь, що їхня здатність до використання в NHT (шляхом оцінки включення нуля в ІП) буде служити лише для подальшого затримки вимирання NHT як інфекційної практики.

Натомість, коли теорії диференціюються лише за розміром ефектів, я припускаю, що баєсовський підхід був би більш доцільним, коли попередній розподіл кожного ефекту визначається кожною моделлю окремо, а отримані задні розподіли порівнюються.

Чи здається таким підхід, замінюючи p-значення, розміри ефекту та довірчі інтервали співвідношенням ймовірності та, якщо необхідно, порівняння байєсівської моделі? Чи пропускає вона якусь необхідну інфекційну особливість, яку надають тут злісні альтернативи?


Може бути питання більш зосередженим? Можливо, про імовірнісно орієнтовані підходи до конкретної проблеми висновку?
сполученийперіор

2
Але поки ми тут: На експозиції: чи ви змішали міри ефекту, як правило, ототожнюються з параметром, для мір порівняльних доказів для повної моделі? ЛР виглядають лише як кандидати для останнього. Крім того, якщо ви хочете, щоб функції вірогідності поодинці або в поєднанні розповідали вам все, що дані намагаються розповісти вам про модель, то ви, по суті, байєсів. Тому що це принцип вірогідності. (Заходьте, вода прекрасна :-)
сполучаєтьсяпріонер

Ваш заголовок і ваш заключний пункт, схоже, не погоджуються щодо того, пропонуєте ви використовувати інтервали довіри або замінити їх.
onestop

@onestop: дійсно, я просто зрозумів, що забув змінити назву; Я передумав щодо інтервалів довіри під час написання запитання. Я зараз редагував заголовок. Вибачення за плутанину.
Майк Лоуренс

@ Попередній зв’язок: Повністю погоджуйтеся з вашими першими двома реченнями. Але ви можете прийняти принцип ймовірності, не будучи баєсом, якщо вам не подобається ідея пріорів і базувати висновки лише на ймовірності - див. Книги Edwards books.google.com/books?id=2a_XZ-gvct4C та Royall books.google .com / books? id = oysWLTFaI_gC . Хоча хтось (і я хочу, щоб я пам’ятав, хто і де) колись порівнював це з розбиттям яєць, але не їв омлет.
onestop

Відповіді:


3

Основними перевагами байєсівського підходу, принаймні для мене як дослідника психології, є:

1) дозволяє збирати докази на користь нуля

2) обходить теоретичні та практичні проблеми послідовного тестування

3) не вразливий для відхилення нуля лише через величезний N (див. Попередній пункт)

4) краще підходить під час роботи з невеликими ефектами (з великими ефектами, як частості, так і байєсовські методи, як правило, весь час погоджуються)

5) дозволяє здійснювати ієрархічне моделювання доцільно. Наприклад, введення ефектів елементів та учасників у деяких модельних класах, як, наприклад, моделі мультиноміального дерева обробки, потрібно проводити в байєсівських рамках, інакше час обчислення буде шалено довгим.

6) отримує у вас "реальні" довірчі інтервали

7) Вам потрібні 3 речі: ймовірність, пріори та ймовірність даних. перше, що ви отримуєте від своїх даних, друге ви складаєте, а третє вам зовсім не потрібно з урахуванням пропорційності. Гаразд, можливо, я трохи перебільшую ;-)

Загалом, можна перевернути ваше запитання: чи все це означає, що класична статистика часто недостатня? Я думаю, що сказати «ні» - це занадто суворий вирок. Більшості проблем можна дещо уникнути, якщо виходити за межі р-значень і переглядати такі речі, як розміри ефектів, можливість впливу ефектів та послідовно копіювати результати (надто багато публікацій з одного експерименту опубліковано!).

Але не все так просто з Байєсом. Візьмемо, наприклад, вибір моделі з вкладеними моделями. У цих випадках пріори є надзвичайно важливими, оскільки вони сильно впливають на результати, а іноді ви не маєте стільки знань щодо більшості моделей, з якими ви хочете працювати, щоб отримати право своїх пріорів. Крім того, займає реально довго ...

Я залишаю дві згадки для тих, хто може бути зацікавлений у зануренні в Байєс.

"Курс байєсівського графічного моделювання когнітивної науки" Лі та Вагенмакерс

" Байєсське моделювання за допомогою WinBUGS" Ntzoufras

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.