Так і ні.
Спочатку "так"
Що ви спостерігали, це те, що коли тест та довірчий інтервал базуються на одній статистиці, між ними існує еквівалентність: ми можемо інтерпретувати -значення як найменше значення для якого нульове значення параметра буде включено в інтервал довіри .pα1−α
Нехай - невідомий параметр у просторі параметрів , і нехай зразок - реалізація випадкової величини . Для простоти визначте довірчий інтервал як випадковий інтервал, такий, що його ймовірність покриття
(Ви також можете розглянути більш загальні інтервали, де ймовірність покриття або обмежена або приблизно дорівнює . Міркування аналогічні.)θΘ⊆Rx=(x1,…,xn)∈Xn⊆RnX=(X1,…,Xn)Iα(X)
Pθ(θ∈Iα(X))=1−αfor all α∈(0,1).
1−α
Розглянемо двосторонній тест точково-нульової гіпотези проти альтернативи . Нехай позначає p-значення тесту. Для будь-якого , відхиляється на рівні , якщо . Область відхилення - це набір які призводять до відхилення :
H0(θ0):θ=θ0H1(θ0):θ≠θ0λ(θ0,x)α∈(0,1)H0(θ0)αλ(θ0,x)≤αα xH0(θ0)
Rα(θ0)={x∈Rn:λ(θ0,x)≤α}.
Тепер розглянемо сімейство двосторонніх тестів із р-значеннями для . Для такої родини ми можемо визначити перевернуту область відхиленняλ(θ,x)θ∈Θ
Qα(x)={θ∈Θ:λ(θ,x)≤α}.
Для будь-якого виправленого , відхиляється, якщо , що відбувається тоді і лише тоді, коли , тобто
Якщо тест базується на тестовій статистиці з повністю заданим абсолютно безперервним нульовим розподілом, то під . Тоді
Оскільки це рівняння справедливо для будь-якогоθ0H0(θ0)x∈Rα(θ0)θ0∈Qα(x)
x∈Rα(θ0)⇔θ0∈Qα(x).
λ(θ0,X)∼U(0,1)H0(θ0)Pθ0(X∈Rα(θ0))=Pθ0(λ(θ0,X)≤α)=α.
θ0∈Θа оскільки з рівняння вище випливає, що звідси випливає, що випадковий набір завжди охоплює істинний параметр з вірогідністю . Отже, позначає доповнення , для всіх маємо
означає, що доповнення перевернутої області відхилення є довірчим інтервалом для .
Pθ0(X∈Rα(θ0))=Pθ0(θ0∈Qα(X)),
Qα(x)θ0αQCα(x)Qα(x)θ0∈ΘPθ0(θ0∈QCα(X))=1−α,
1−αθ
Ілюстрація наведена нижче, показуючи області відхилення та довірчі інтервали, що відповідають -тесту для нормальної середньої величини, для різних нульових засобів та різних засобів вибірки , з . відхиляється, якщо знаходиться в затіненій світло-сірій області. Темно-сірим кольором показано область відхилення та довірчий інтервал .
zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Значна частина цього взята з моєї кандидатської дисертації .)
Тепер для "ні"
Вище я описав стандартний спосіб побудови довірчих інтервалів. У цьому підході ми використовуємо деяку статистику, пов'язану з невідомим параметром для побудови інтервалу. Є також інтервали на основі алгоритмів мінімізації, які прагнуть звести до мінімуму довжину інтервалу стану від величини . Зазвичай такі інтервали не відповідають тесту.θX
Це явище пов'язане з проблемами, пов'язаними з тим, що такі інтервали не вкладаються, тобто інтервал 94% може бути коротшим, ніж інтервал 95%. Докладніше про це дивіться в Розділі 2.5 цієї останньої шахти (з’являється в Бернуллі).
І друге "ні"
У деяких проблемах стандартний довірчий інтервал не базується на тій же статистиці, що і стандартний тест (про який розповів Майкл Фей у цій роботі ). У цих випадках інтервали довіри та тести можуть не дати однакових результатів. Наприклад, може бути відхилено тестом, навіть якщо 0 включено в довірчий інтервал. Це не суперечить вище "так", оскільки використовуються різні статистичні дані.θ0=0
І іноді "так" - це не дуже добре
Як зазначає f coppens у коментарі, іноді інтервали та тести мають дещо суперечливі цілі. Ми хочемо короткі інтервали та випробування з високою потужністю, але найкоротший інтервал не завжди відповідає тесту з найбільшою потужністю. Деякі приклади цього див. У цій роботі (багатоваріантне нормальне розподіл), або в цьому (експоненціальне розподіл), або у розділі 4 моєї тези .
Баєси можуть також сказати і так, і ні
Деякі роки тому я розмістив тут питання про те, чи існує еквівалентність тесту-інтервалу також у байєсівській статистиці. Коротка відповідь полягає в тому, що, використовуючи стандартне тестування гіпотез Баєса, відповідь - «ні». Трохи переформулюючи проблему тестування, відповідь може бути "так". (Мої спроби відповісти на моє власне питання врешті-решт перетворилися на статтю !)