Для тестування гіпотез можна використовувати інтервал довіри (CI). У типовому випадку, якщо CI для ефекту не охоплює 0, то ви можете відхилити нульову гіпотезу. Але CI можна використовувати для більшого, тоді як повідомлення про те, чи було пройдено це межа корисності тесту.
Наприклад, вам рекомендують використовувати CI замість просто t-тесту, тому що тоді ви можете зробити більше, ніж просто перевірити гіпотези. Ви можете зробити заяву про спектр ефектів, які, на вашу думку, є ймовірними (такі, що стосуються ІС). Ви не можете зробити це лише за допомогою t-тесту. Ви також можете використовувати його для створення заяв про нуль, чого ви не можете зробити з t-тестом. Якщо t-тест не відхиляє нуль, ви просто скажете, що не можете відхилити нуль, що не говорить дуже багато. Але якщо у вас є вузький інтервал довіри навколо нуля, то ви можете припустити, що нуль або близьке до нього значення, ймовірно, є справжнім значенням, і припустити, що ефект від лікування або незалежна змінна є занадто малим, щоб мати значення ( або що ваш експеримент не відповідає "
Додано пізніше:
Я дійсно повинен був сказати, що, хоча ви можете використовувати CI як тест, він не один. Це оцінка діапазону, в якому, на вашу думку, лежать значення параметра. Ви можете зробити тест, як умовиводи, але вам просто набагато краще ніколи про це не говорити.
Який краще?
А) Ефект дорівнює 0,6, t (29) = 2,8, p <0,05. Цей статистично значущий ефект є ... (деяка дискусія ведеться про цю статистичну значущість без жодної згадки або навіть сильної здатності обговорювати практичні наслідки масштабу знахідки ... у рамках Неймана-Пірсона величина t і Значення p майже безглузді, і все, що ви можете обговорити, - чи є ефект чи не знайдений. Ви ніколи не можете реально говорити про те, що насправді це не ефект, заснований на тесті.)
або
Б) Використовуючи довірчий інтервал 95%, я оцінюю ефект між 0,2 та 1,0. (деяка дискусія продовжує говорити про фактичний ефект, що цікавить, чи правдоподібні значення - це ті, які мають якесь особливе значення, і будь-яке використання слова, яке має значення саме для того, що воно повинно означати. Крім того, ширина CI може переходити безпосередньо до обговорення того, чи є це вагомим висновком, чи ви можете лише дійти більш попереднього висновку)
Якщо ви взяли базовий клас статистики, ви можете спочатку тяжіти до А. І можуть бути деякі випадки, коли це кращий спосіб повідомити про результат. Але для більшості робіт B набагато вищий. Оцінка діапазону не є тестом.