Два визначення р-значення: як довести їх еквівалентність?


11

Я читаю книгу Ларрі Вассермана " Вся статистика" , а зараз про p-значення (стор. 187). Дозвольте спочатку представити деякі визначення (цитую):

R

β(θ)=Pθ(XR)
α=supθΘ0β(θ)
αα

Це в основному говорить про те, що α , розмір є "найбільшою" ймовірністю помилки типу I. Потім значення p значення визначається через (я цитую)

Визначення 2 Припустимо, що для кожного α(0,1) ми маємо тест розміру α з областю відхилення Rα . Тоді

p-value=inf{α:T(Xn)Rα}
де Xn=(X1,,Xn) .

Для мене це означає: з урахуванням конкретного α існує область тесту та відхилення Rα так що α=supθΘ0(α)Pθ(T(Xn)Rα) . Для p -значення я просто беру найменший з усіх цих α .

Питання 1 Якщо це було б так, я міг би чітко вибрати для довільно малого . Що таке моє неправильне тлумачення визначення 2, тобто що воно точно означає?α=ϵϵ

Тепер Вассерман безперервно і заявляє теорему про «еквівалентне» визначення -значення, з яким я знайомий (цитую):p

Теорема Припустимо, що тест розміру має форму Тоді де - спостережуване значення .α

reject H0T(Xn)cα
p-value=supθΘ0Pθ(T(Xn)T(xn))
xnXn

Отже, ось моє друге питання:

Запитання 2 Як я можу насправді довести цю теорему? Можливо, це пов’язано з моїм нерозумінням визначення значення, але я не можу це зрозуміти.p


4
Позитивно дивно, що Вассерман визначав владу як " ", оскільки символ майже універсально використовується для коефіцієнта помилок типу II (тобто потужність = 1- для майже будь-якого іншого автора, що обговорює владу). Мені важко уявити вибір позначень, здатних викликати гіршу плутанину, за винятком випадків, коли вони навмисно налаштовані викликати це. βββ
Glen_b -Встановіть Моніку

1
Я погоджуюся, що це дивно, Глен - однак, Казелла та Бергер роблять те саме, і їхній текст, на мій погляд, є золотим стандартом статистичної теорії.
Метт Бремс

Відповіді:


6

У нас є кілька багатовимірних даних , отриманих з розподілу з невідомим параметром . Зауважте, що - вибіркові результати.xDθx

Ми хочемо перевірити деяку гіпотезу про невідомий параметр , значення під нульовою гіпотезою знаходяться у множині .θθθ0

У просторі ми можемо визначити область відхилення , а потужність цієї області визначається як . Таким чином, потужність обчислюється для певного значення of як ймовірність того, що результат вибірки знаходиться в області відхилення коли значення дорівнює . Очевидно, що потужність залежить від області та вибраного .XRRPθ¯R=Pθ¯(xR)θ¯θxR θθ¯Rθ¯

Визначення 1 визначає розмір областіR як надсумову всіх значень для у , тому лише для значень під . Очевидно , що це залежить від регіону, так .Pθ¯Rθ¯θ0θ¯H0αR=supθ¯θ0Pθ¯R

Оскільки залежить від ми маємо інше значення, коли область змінюється, і це є підставою для визначення p-значення: змінити область, але таким чином, щоб спостережуване значення вибірки все-таки належало області, для кожна така область, обчислити , як визначено вище , і нижня межа береться: . Отже p-значення - це найменший розмір усіх регіонів, що містять .αRRαRpv(x)=infR|xRαRx

Теорема - це лише її "переклад", а саме випадок, коли області визначаються за допомогою статистики а для значення ви визначаєте область як . Якщо ви використовуєте цей тип області у наведених вище міркуваннях, то теорема випливає.RTcRR={x|T(x)c}R

EDIT через коментарі:

@ user8: для теореми; якщо визначити області відхилення як у теоремі, то область відхилення розміром - це набір, який виглядає як для деяких .αRα={X|T(X)cα}cα

Щоб знайти p-значення спостережуваного значення , тобто ви повинні знайти найменшу область , тобто найбільше значення таке, що все ще містить , остання (область містить ) еквівалентна (через спосіб визначення регіонів) тому, що , тому ви повинні знайти найбільший такий, щоxpv(x)Rc{X|T(X)c} xxcT(x)c{X|T(X)c&cT(x)}

Очевидно, що найбільший такий, що повинен бути і тоді множина supra стаєccT(x)c=T(x){X|T(X)c=T(x)}={X|T(X)T(x)}


Велике спасибі за вашу відповідь. Щодо питання про валідацію теореми: чи не існує якогось над ? infα
математика

@ user8: Я додав абзац наприкінці своєї відповіді, ви бачите крапку з infimum зараз?

7

У визначенні 2 -значення тестової статистики є найбільшою нижньою межею всіх така що гіпотеза відхиляється для тесту розміру . Нагадаємо, що чим менше ми робимо , тим менше допускається помилка типу I, яку ми допускаємо, таким чином область відхилення також зменшиться. Тож (дуже) неофіційно кажучи, значення -значення є найменшою ми можемо вибрати, що все ще дозволяє нам відкидати для даних, які ми спостерігали. Ми не можемо довільно вибрати меншу оскільки в якийсь моментpαααRαpαH0αRα буде настільки малим, що виключатиме (тобто не вміщує) події, яку ми спостерігали.

Тепер, з огляду на сказане, я пропоную вам переглянути теорему.


Я ще трохи розгублений. Отже, по-перше, у визначенні фіксується статистика для всіх ? Я не згоден з вашим твердженням: "... в якийсь момент буде настільки малим, що виключатиме (тобто не вміщує) події, яку ми спостерігали". Ідеально добре, якщо настільки малий, що не містить спостережуваного зразка, ми не відкидаємо . У чому проблема в цьому? дякую за допомогу / терпіння2TαRαRαH0
математика

Так. Тестова статистика - це заздалегідь визначена фіксована функція вибірки, де "фіксована" в цьому сенсі означає, що форма функції не змінюється для будь-якого . Значення, яке воно приймає, може (і повинно) залежати від вибірки. Ваше твердження "ми не відхиляємо " виявляє, чому ваша незгода неправильна: за визначенням , містить набір усіх значень, для яких статистика тесту призводить до відхилення нуля . Ось чому він позначений - для викиду "R". Я опублікую оновлення своєї відповіді, щоб пояснити більш детально. TαH0RαR
heropup

Дякую за швидку відповідь та заздалегідь за вашу оновлену версію. Я мав на увазі таке: Ми відкидаємо якщо , де - спостережуваний зразок. Скажіть, що я дуже екстремальний і вибираю дуже малий, так що для даного зразка що означає, що ми НЕ відхиляємо . Так що маленький isnt apriori погана річ. Ясна річ, що в один момент вона настільки мала, що дуже дуже малоймовірно спостерігати зразок, що належить до . Ще раз дякую за терпіння / допомогу. дуже цінується! H0T(xn)RαxnRαT(xn)RαH0RαRα
математика

2
Дане визначення р-значення явно вимагає тестової статистики, щоб зразок знаходився в області відхилення . Ви не можете змінювати цю частину визначення р-значення.
Glen_b -Встановити Моніку

@Glen_b Дякую за коментар. Дійсно, мій попередній коментар порушує це визначення. Дякуємо, що вказали на це.
математика
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.