Найпростіше , що потрібно зробити, ймовірно , буде тест знаком. Нульова гіпотеза полягає в тому, що кожен результат має однакову ймовірність бути позитивним чи негативним (наприклад, гортаючи справедливу монету). Ваша мета - визначити, чи спостережувані результати були б малоймовірними за цією нульовою гіпотезою, що ви можете її відхилити.
Яка ймовірність отримати 80 і більше голів із 100 обертів справедливої монети? Ви можете обчислити це за допомогою біноміального розподілу. В R
, викликається відповідна функція pbinom
, і ви можете отримати (однобічне) p-значення, використовуючи наступний рядок коду:
pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)
Згідно з цим тестом, ваша інтуїція правильна, ви навряд чи випадково отримаєте 80 позитивних результатів, якби лікування не мало ефекту.
Тісно пов'язаним варіантом було б використовувати щось на кшталт тестування з підписанням Вілкоксоном .
Краще підхід, якщо ви на справді хочете , щоб оцінити величину ефекту (а не просто визначити , як правило , є чи може це бути більше нуля чи ні), ймовірно , буде ієрархічна ( «змішаний») модель.
Тут модель говорить про те, що результати ваших 100 осіб походять від розподілу, і ваша мета - побачити, де знаходиться середнє значення для цього розподілу (разом з інтервалами довіри).
Змішані моделі дозволяють вам сказати трохи більше про розміри ефекту: після встановлення моделі ви можете сказати щось на кшталт "ми вважаємо, що наше лікування має тенденцію до покращення результатів в середньому на три одиниці, хоча дані відповідають справжньому середньому розмір ефекту становить від 1,5 до 4,5 одиниць. Також серед осіб є певна різниця, тому дана людина може побачити ефект десь від -0,5 до +6,5 одиниць ".
Це дуже точний і корисний набір тверджень - набагато краще, ніж просто "ефект, мабуть, в середньому позитивний", саме тому такому підходу, як правило, прихильні статистики. Але якщо вам не потрібна вся ця деталь, перший підхід, який я згадав, теж може бути добре.