Насправді, значення p також тепер нарешті не вийшло з моди: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 . Тест на значимість гіпотези (NHST) дає трохи більше, ніж опис розміру вашої вибірки. (*) Будь-яке експериментальне втручання матиме певні ефект, тобто, що проста строкова нульова гіпотеза «без ефекту» завжди є хибною у строгому розумінні . Отже, "незначний" тест просто означає, що розмір вибірки був недостатньо великим; "вагомий" тест означає, що ви зібрали достатньо даних, щоб "щось знайти".
"Розмір ефекту" являє собою спробу виправити це шляхом введення міри в природному масштабі проблеми. У медицині, де лікування завжди є певний ефект (навіть якщо це ефект плацебо), вводиться поняття "клінічно значущого ефекту", щоб запобігти 50% попередньої ймовірності того, що "лікування" виявиться "( статистично) значущий позитивний ефект "(хоча і незначний) у довільно великому дослідженні.
Якщо я розумію природу вашої роботи, кларнетист, то наприкінці дня її законною метою є інформування про дії / втручання, які покращують освіту в школах, що знаходяться під вашим завданням. Таким чином, ваше налаштування є теоретичним рішенням , а байєсівські методи є найбільш підходящими (і однозначно узгоджений [1] ) підхід.
Дійсно, найкращий спосіб зрозуміти частолістські методи - це наближення до байєсівських методів . Розрахунковий розмір ефекту можна розуміти як націлений на міру центральності байєсівського заднього розподілу , тоді як р-значення можна розуміти як спрямоване на вимірювання одного хвоста цієї задньої частини. Таким чином, ці дві величини разом містять деяку грубу суть байєсівської задньої частини, яка є природним внеском до теоретичного світогляду рішення щодо вашої проблеми. (Крім того, частотний довірчий інтервал щодо розміру ефекту можна розуміти так само, як імовірний інтервал Wannabe .)
У галузях психології та освіти байєсівські методи насправді досить популярні. Однією з причин цього є те, що легко встановлювати «конструкції» в байєсівські моделі як латентні змінні. Ви можете перевірити "цуценя книжку" Джона К. Крушке , психолога. В освіті (де у вас є вкладені учні в аудиторії, вкладені в школах, вкладені в округи, ...) ієрархічне моделювання неминуче. І байєсівські моделі також чудово підходять для ієрархічного моделювання. На цьому рахунку ви можете перевірити Gelman & Hill [2].
[1]: Роберт, Крістіан П. Байєсівський вибір: від теоретичних основ прийняття рішень до обчислювальної імплементації. 2-е вид. Тексти Спрінгера в статистиці. Нью-Йорк: Спрингер, 2007.
[2]: Гельман, Ендрю та Дженніфер Хілл. Аналіз даних за допомогою регресійної та багаторівневої / ієрархічної моделей. Аналітичні методи соціальних досліджень. Кембридж; Нью-Йорк: Cambridge University Press, 2007.
Більш детальну інформацію про "узгодженість" з точки зору не обов'язково бити-ти-в-голову-з-байєсівської цегли див. [3].
[3]: Робінс, Джеймс та Ларрі Вассерман. "Умова, ймовірність та узгодженість: огляд деяких основних понять". Журнал Американської статистичної асоціації 95, вип. 452 (1 грудня 2000 р.): 1340–46. doi: 10.1080 / 01621459.2000.10474344.
(*) У [4] Meehl биє NHST набагато елегантніше, але не менш абразивно, ніж я:
Оскільки нульова гіпотеза є хибною завжди хибною, таблиці, що підсумовують дослідження з огляду на закономірності «суттєвих відмінностей», є дещо більш ніж складними, причинно непереборними результатами функцій статистичної влади.
[4]: Meehl, Paul E. "Теоретичні ризики та табличні зірочки: сер Карл, сер Рональд і повільний прогрес м'якої психології". Journal of Consulting and Clinical Psychiatry 46 (1978): 806–34. http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf
А ось пов’язана цитата з Tukey: /stats//a/728/41404