У нас є кілька багатовимірних даних , отриманих з розподілу з невідомим параметром . Зауважте, що - вибіркові результати.xDθx
Ми хочемо перевірити деяку гіпотезу про невідомий параметр , значення під нульовою гіпотезою знаходяться у множині .θθθ0
У просторі ми можемо визначити область відхилення , а потужність цієї області визначається як . Таким чином, потужність обчислюється для певного значення of як ймовірність того, що результат вибірки знаходиться в області відхилення коли значення дорівнює . Очевидно, що потужність залежить від області та вибраного .XRRPRθ¯=Pθ¯(x∈R)θ¯θxR θθ¯Rθ¯
Визначення 1 визначає розмір областіR як надсумову всіх значень для у , тому лише для значень під . Очевидно , що це залежить від регіону, так .PRθ¯θ¯θ0θ¯H0αR=supθ¯∈θ0PRθ¯
Оскільки залежить від ми маємо інше значення, коли область змінюється, і це є підставою для визначення p-значення: змінити область, але таким чином, щоб спостережуване значення вибірки все-таки належало області, для кожна така область, обчислити , як визначено вище , і нижня межа береться: . Отже p-значення - це найменший розмір усіх регіонів, що містять .αRRαRpv(x)=infR|x∈RαRx
Теорема - це лише її "переклад", а саме випадок, коли області визначаються за допомогою статистики а для значення ви визначаєте область як . Якщо ви використовуєте цей тип області у наведених вище міркуваннях, то теорема випливає.RTcRR={x|T(x)≥c}R
EDIT через коментарі:
@ user8: для теореми; якщо визначити області відхилення як у теоремі, то область відхилення розміром - це набір, який виглядає як для деяких .αRα={X|T(X)≥cα}cα
Щоб знайти p-значення спостережуваного значення , тобто ви повинні знайти найменшу область , тобто найбільше значення таке, що все ще містить , остання (область містить ) еквівалентна (через спосіб визначення регіонів) тому, що , тому ви повинні знайти найбільший такий, щоxpv(x)Rc{X|T(X)≥c} xxc≥T(x)c{X|T(X)≥c&c≥T(x)}
Очевидно, що найбільший такий, що повинен бути і тоді множина supra стаєcc≥T(x)c=T(x){X|T(X)≥c=T(x)}={X|T(X)≥T(x)}