Нульова гіпотеза еквівалентності


11

Припустимо, - простий випадковий вибірки з нормального розподілу. ( μ , σ 2 )X1,X2,...,Xn(μ,σ2)

Мені цікаво зробити наступний тест на гіпотезу: для заданої постійної .c > 0

H0:|μ|cH1:|μ|>c,
c>0

Я думав про те, щоб виконати два односторонні -тести (TOST) аналогічно звичайній ситуації тестування на біоеквівалентність, де нуль і є замість цього, але я не знаю, чи це має сенс чи правильно.| мк | ct|μ|c

Моя ідея - виконати односторонні тести та і відхилити глобальну нульову гіпотезу, якщо одне з -значень менше рівня значущості .H 02 : μ - c

H01:μcH11:μ>c
p α
H02:μcH12:μ<c,
pα

Спасибі заздалегідь!

Редагувати:

Я трохи думав про це, і думаю, що запропонований мною підхід не має рівня значущості .α

Припустимо, що справжнє значення є і відомо.µ 0 σ 2μμ0σ2

Імовірність відхилення нуля в першому тесті - де якщо стандартний cdf звичайного розподілу, а - таке значення, що .Φz1-αΦ(z1-α)=1-α

Pμ0(Rej.H01)=1Φ(z1α+cμ0σ/n),
Φz1αΦ(z1α)=1α

Якщо , . Тоді, якщо , . Як варіант, якщо , .P μ 0 ( R e j . H 01 ) = α μ 0 > c P μ 0 ( R e j . H 01 ) > α μ 0 < c P μ 0 ( R e j . H 01 ) < αμ0=cPμ0(Rej.H01)=αμ0>cPμ0(Rej.H01)>αμ0<cPμ0(Rej.H01)<α

Ймовірність відхилення нуля у другому тесті -

Pμ0(Rej.H02)=Φ(z1αμ0+cσ/n).

Знову ж таки, якщо нас є . Аналогічно, якщо , . Нарешті, якщо , .P μ 0 ( R e j . H 02 ) = α μ 0 > - c P μ 0 ( R e j . H 02 ) < α μ 0 < - c P μ 0 ( R e j . H 02 ) > αμ0=cPμ0(Rej.H02)=αμ0>cPμ0(Rej.H02)<αμ0<cPμ0(Rej.H02)>α

Оскільки області відхилення двох тестів роз'єднані, ймовірність відхилення дорівнює: P μ 0 ( R e j . H 0 ) = 1 - Φ ( z 1 - α + c - μ 0H0

Pμ0(Rej.H0)=1Φ(z1α+cμ0σ/n)+Φ(z1αμ0+cσ/n)

Отже, якщо , є верхньою межею ймовірності відхилення (глобальної) нульової гіпотези. Тому підхід, який я запропонував, був надто ліберальним.2 αμ[c,c]2α

Якщо я не помиляюся, ми можемо досягти рівня значущості , зробивши ті ж два тести і відкинувши нуль, якщо -значення одного з них менше . Аналогічний аргумент справедливий, коли дисперсія невідома і нам потрібно застосувати -test.p α / 2 tαpα/2t


Правка знаходиться на правильному шляху :-).
whuber

Відповіді:


3

Дуже цікаве запитання !!

Ви використовуєте логічний наслідок, тобто умову посягання. Ця умова тягне за собою основу класичної логіки, вона гарантує висновок або виведення результату з передумови.

Обґрунтування вашої пропозиції наступне:

Якщо тягне за собою , то спостережувані дані повинні мати більше доказів проти ніж .H 0 H 0 H 0H0H0H0H0

З точки зору ваших допоміжних гіпотез і , ми маємо , тобто тягне за собою а також тягне за собою . Отже, відповідно до умови сприйняття, нам слід спостерігати більше доказів проти ніж або . Потім ви зробили висновок, що якщо одне з p-значень, обчислених під або є достатньо малим, значення p, обчислене під буде ще меншим. H 02 H 0H 01H 02 H 0 H 01 H 0 H 02 H 0 H 01 H 02 H 01 H 02 H 0H01H02H0H01H02H0H01H0H02H0H01H02H01H02H0

Однак це логічне міркування не вірно для p-значень, тобто p-значення не відповідають логічному наслідку. Кожне p-значення будується за певною нульовою гіпотезою, тому р-значення для різних нульових гіпотез обчислюються за різними показниками. З цієї причини p-значення не можуть поважати логічні міркування щодо простору параметрів (або простору нульових гіпотез).

Приклади, коли p-значення порушують умови залучення, представлені в Schervish (1996) та Patriota (2013). В останньому документі наведено приклади двовимірного нормального розподілу та регресійної моделі (див. Приклади 1.1 та 1.2 на сторінках 5 та 6 відповідно). Еран Равів надає алгоритм в R-коді для двовимірного випадку. Навчання з цих прикладів таке: ви повинні обчислити р-значення безпосередньо для нульової гіпотези, що цікавить. Schervish (1996) надає формулу p-значення для вашого прикладу, коли і , див. Формула (2) на сторінці 204. Якщо ви хочете обчислити p-значення, ви повинні адекватно цю формулу для ваш випадок.σ 2 = 1n=1σ2=1

Патріота (2013) пропонує нову міру доказів для перевірки загальних нульових гіпотез (складених чи простих нульових гіпотез), що враховують логічний наслідок. Цей показник називається s-значенням у роботі. Для вашого прикладу процедура порівняно проста:

  1. Знайдіть інтервал довіри (1- ) для (асимптотичний): , де - середня вибірка, - дисперсія вибірки , - стандартного нормального розподілу і - розмір вибірки.αμI(μ,α)=[x¯zα/2s2n ; x¯+zα/2s2n]x¯s2zα/2α/2n

  2. Знайдіть значення для якого амплітуда мінімальна і має принаймні один спільний елемент з (тобто, границя ). Це - значення .αI(μ,α){c,c}[c,c]αs

  3. З одного боку, якщо , то спостережуваний зразок підтверджує нульову гіпотезу ; якщо значення значення досить мале, ви можете прийняти нуль. З іншого боку, якщо , то спостережуваний зразок надає інформацію проти нульової гіпотези ; якщо значення значення досить мало, то ви можете відхилити нуль. В іншому випадку не слід відхиляти або приймати нуль.x¯[c,c]H0:|μ|csx¯[c,c]H0s

Зауважте, що якщо і відповідне -значення надзвичайно мало, це означає, що альтернативна гіпотеза надзвичайно далека від максимально правдоподібного значення . Якщо і відповідне значення вкрай мало, це означає, що нульова гіпотеза надзвичайно далеко від максимально правдоподібного значення . Спробуйте намалювати картину, що представляє довірчий інтервал та нульову гіпотезу, що цікавить, щоб краще зрозуміти висновки. Для отримання додаткової інформації, будь ласка, прочитайте оригінал статті Patriota (2013).x¯[c,c]sx¯x¯[c,c]sx¯

Як знайти об'єктивні пороги прийняття чи відхилення нуля за допомогою цього -значення, залишається відкритою проблемою. Цей підхід є приємним, оскільки ми можемо прийняти нульову гіпотезу. Це має сенс кожного разу, коли спостережуваний зразок підтверджує нульове значення, і це далеко від альтернативи. У вашому прикладі видно для , , і . Досить просто побачити, що щільність даних надзвичайно сконцентрована на (в десять разів перевищує стандартну помилку). Для того, щоб було не порожнє перехрестя з , потрібно 99900 стандартних помилок. Тому було б справедливо прийнятиc = 1000 ˉ x = 1 s 2 = 1 n = 10000 [ 0,9 , 1,1 ] [ - 1000 , 1000 ] H 0 : | мк | csc=1000x¯=1s2=1n=10000[0.9, 1.1][1000, 1000]H0:|μ|c в цьому випадку.

Список літератури:

Патріота, AG (2013). Класична міра доказів для загальних нульових гіпотез, Нечіткі набори та системи, 233, 74–88

Schervish, MJ (1996). P Значення: Що вони є, а що ні, Американський статистик, 50, 203–206.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.