Я не думаю, що більшість цих відповідей насправді відповідають на це питання в цілому. Вони обмежуються випадком, коли існує проста нульова гіпотеза і коли тестова статистика має неперевернутий CDF (як у безперервній випадковій змінній, яка має різко зростаючий CDF). Ці випадки є випадками, про які більшість людей схильні дбати за допомогою z-тесту та t-тесту, хоча для тестування біноміального середнього (наприклад) у такого немає CDF. Те, що надано вище, здається правильним для моїх очей для цих обмежених випадків.
Якщо нульові гіпотези складені, то справи дещо складніші. Найбільш загальний доказ цього факту, який я бачив у складеному випадку з використанням деяких припущень щодо регіонів відторгнення, наведено у «Тестуванні статистичних гіпотез» Лемана та Романо на сторінках 63-64. Я спробую відтворити аргумент нижче ...
Ми тестуємо нульову гіпотезу проти альтернативної гіпотези на основі тестової статистики, яку ми будемо позначати як випадкової величини . Тестова статистика припускається з якогось параметричного класу, тобто , де є елементом сімейства розподілів ймовірностей , а - простір параметрів. Нульова гіпотеза та альтернативна гіпотеза утворюють розділ у тому
H0H1XX∼PθPθP≡{Pθ∣θ∈Θ}ΘH0:θ∈Θ0H1:θ∈Θ1ΘΘ=Θ0∪Θ1
де
Θ0∩Θ1=∅.
Результат тесту може бути позначений
де для будь-якого набору визначаємо
Тут - наш рівень значущості, а позначає область відхилення тесту на рівень значущості .ϕα(X)=1Rα(X)
S1S(X)={1,0,X∈S,X∉S.
αRαα
Припустимо, регіони відхилення задовольняють
якщо . У цьому випадку вкладених областей відхилення корисно визначити не тільки, чи відхилена нульова гіпотеза на заданому рівні значущості , але й визначити найменший рівень значущості, для якого нульова гіпотеза буде відхилена. Цей рівень відомий як значення p ,
це число дає нам уявлення про наскільки сильні дані (як зображено тестовою статистикою ) суперечать нульовій гіпотезі . Rα⊂Rα′
α<α′αp^=p^(X)≡inf{α∣X∈Rα},
XH0
Припустимо, що для деякої і . Припустимо також, що регіони відхилення підпорядковуються зазначеному вище властивості введення. Потім виконується наступне:X∼Pθθ∈ΘH0:θ∈Θ0Rα
Якщо для всіх , то для ,
supθ∈Θ0Pθ(X∈Rα)≤α0<α<1θ∈Θ0Pθ(p^≤u)≤ufor all0≤u≤1.
Якщо для маємо для всіх , то для маємо
θ∈Θ0Pθ(X∈Rα)=α0<α<1θ∈Θ0Pθ(p^≤u)=ufor all0≤u≤1.
Зверніть увагу, що це перше властивість просто говорить нам про те, що хибнопозитивна швидкість регулюється на шляхом відхилення, коли значення p менше, ніж , а друге властивість говорить нам (з урахуванням додаткового припущення), що значення p рівномірно розподіляються під нулем гіпотеза.uu
Доказ такий:
Нехай , і припустимо для всіх . Тоді за визначенням маємо для всіх . З монотонності та припущення випливає, що для всіх . Випускаючи , випливає, що .θ∈Θ0supθ∈Θ0Pθ(X∈Rα)≤α0<α<1p^{p^≤u}⊂{X∈Rv}u<vPθ(p^≤u)≤Pθ(X∈Rv)≤vu<vv↘uPθ(p^≤u)≤u
Нехай , і припустимо, що для всіх . Тоді , і за монотонністю випливає, що . Розглядаючи (1), випливає, що . θ∈Θ0Pθ(X∈Rα)=α0<α<1{X∈Ru}⊂{p^(X)≤u}u=Pθ(X∈Ru)≤Pθ(p^≤u)Pθ(p^(X)≤u)=u
Зауважимо, що припущення в (2) не виконується, коли статистика тесту є дискретною, навіть якщо нульова гіпотеза проста, а не складна. Візьмемо для прикладу з та . Тобто, переверніть монету десять разів і перевірте, чи справедливо проти упередженого по відношенню до головок (закодовано як 1). Ймовірність побачити 10 голів у 10 ярмаркових монетах - (1/2) ^ 10 = 1/1024. Ймовірність побачити 9 або 10 голів у 10 справедливих монетках - 11/1024. Для будь-якого строго між 1/1024 та 11/1024, ви відхилите нуль, якщо , але у нас немає цього для цих значень колиX∼Binom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(X∈Rα)=ααθ=0.5 . Натомість для таких . Pr(X∈Rα)=1/1024α