Обґрунтування односхилого тестування гіпотез


35

Я розумію тестування гіпотез з двома хвостами. У вас є (проти ). Значення значення - це ймовірність того, що генерує дані принаймні такі ж крайні, як і те, що спостерігалося.H 1 = ¬ H 0 : θ θ 0 p θH0:θ=θ0H1=¬H0:θθ0pθ

Я не розумію тестування гіпотез з односторонніми відомостями. Тут (проти ). Визначення p-значення не повинно було змінюватися зверху: все одно має бути ймовірність того, що генерує дані принаймні настільки ж екстремально, як і те, що спостерігалося. Але ми не знаємо , лише те, що це верхнє обмеження .H 1 = ¬ H 0 : θ > θ 0 θH0:θθ0H1=¬H0:θ>θ0θ θ 0θθ0

Тому замість цього я бачу тексти, які дозволяють нам припустити, що (не відповідно до ) і обчислюю ймовірність того, що це генерує дані принаймні настільки ж екстремально, як і те, що спостерігалося, але лише на одному кінці . Здається, це технічно не має нічого спільного з гіпотезами. θ θ 0 H 0θ=θ0θθ0H0

Тепер я розумію , що це частотна перевірка гіпотези, і що frequentists не встановлюють апріорні на їх s. Але хіба це не означає, що гіпотези тоді неможливо прийняти чи відкинути, а не підписати вищевказаний розрахунок на малюнок?θ


Аналогічне запитання було задано згодом stats.stackexchange.com/questions/8196/…
robin girard

1
Ваше визначення -значення є неповним. Слід прочитати (наголос додано): -значення - це ймовірність того, що генерує дані принаймні настільки ж крайні, як і те, що спостерігалось, припускаючи, що нульова гіпотеза є істинною . p θppθ
Олексій

Відповіді:


34

Це продумане питання. Багато текстів (можливо, з педагогічних причин) опрацьовують це питання. Що насправді відбувається, це те, що - це складна "гіпотеза" у вашій однобічній ситуації: це насправді набір гіпотез, а не одна. Потрібно, щоб для кожної можливої ​​гіпотези вH0 θ 0 H 0H0, шанс потрапляння тестової статистики у критичну область повинен бути меншим або рівним розміру тесту. Більше того, якщо тест насправді має досягти свого номінального розміру (що є хорошою справою для досягнення високої потужності), то верхня сума цих шансів (перейнята всіма нульовими гіпотезами) повинна дорівнювати номінальному розміру. На практиці для простих однопараметричних тестів розташування, що включають певні "приємні" сімейства розподілів, ця надбудова досягається для гіпотези з параметром . Таким чином, як практична справа, всі обчислення зосереджені саме на цьому розподілі. Але ми не повинні забувати про решту множини : це вирішальне розмежування між двосторонніми та односторонніми тестами (і між "простими" та "складовими"θ0H0

Це тонко впливає на інтерпретацію результатів однобічних тестів. Коли нульове значення відхилено, ми можемо сказати, що докази вказують на справжній стан природи будь-якого з розподілів у . Коли нуль не відхилено, можна лише сказати, що існує розподіл у який "відповідає" спостережуваним даним. Ми не кажемо, що всі розподіли в відповідають даним: далеко не це! Багато з них можуть дати дуже низьку ймовірність.H 0 H 0H0H0H0


Все, що ви сказали, є дійсним і важливим. Ще один важливий аспект, який я думаю, полягає в тому, що зазвичай нульова гіпотеза розглядається як нецікава гіпотеза. Альтернатива розглядається як наукова гіпотеза. Це те, що експериментатор хотів би довести. Я кажу, що зазвичай це тест на еквівалентність та непридатність. Тепер щодо питання про одностороннє тестування лише скажіть ту сторону, яка має параметр більше, ніж нульове значення, яке цікаве. Таким чином, всі значення на меншій стороні закладені в нуль.
Майкл Р. Черник

stats.stackexchange.com/questions/333301/… Якщо ви хочете дати відповідь на це запитання чи вказати мені на якусь бібліографію ...;)
Старий чоловік у морі.

6

Я бачу -значення як максимальну ймовірність помилки I типу. Якщо , ймовірність помилки типу I може бути фактично нульовою, але так і нехай. Якщо дивитись на тест з точки зору мінімакс, супротивник ніколи б не заглиблювався з глибини "нутрощів" нульової гіпотези, і на силу не слід впливати. Для простих ситуацій (наприклад, test) можна побудувати тест із гарантованою максимальною швидкістю I типу, що допускає такі однобічні нульові гіпотези.θ θ 0 tpθθ0t


2

Ви б використовували односторонній тест на гіпотезу, якщо лише результати в одному напрямку підтримують висновок, який ви намагаєтесь зробити.

Подумайте про це в питанні, яке ви задаєте. Припустимо, наприклад, ви хочете дізнатися, чи призводить ожиріння до підвищеного ризику серцевого нападу. Ви збираєте свої дані, які можуть складатися з 10 людей, які страждають ожирінням та 10 людей, які не страждають ожирінням. Тепер скажемо, що через незаписані заплутані фактори, поганий експериментальний дизайн або просто невдача, ви помічаєте, що лише у 2 з 10 людей, які страждають ожирінням, є серцеві напади, порівняно з 8 людьми, що не страждають ожирінням.

Тепер, якби ви провели двосторонній тест на гіпотезу за цими даними, ви зробите висновок про наявність статистично значущої асоціації (р ~ 0,02) між ожирінням та ризиком серцевого нападу. Однак асоціація буде в тому напрямку, протилежному тому, яке ви насправді очікували побачити, отже, результат тесту був би введеним в оману.

(У реальному житті експеримент, що призвів до такого контрінтуїтивного результату, може призвести до додаткових цікавих для себе питань: наприклад, процес збору даних може бути вдосконалений, або можуть бути раніше невідомі фактори ризику на роботі, або можливо, звичайна мудрість просто помиляється. Але ці питання насправді не пов'язані з вузьким питанням того, який тест гіпотези слід використовувати.)


2

pH0H00.5H10.5

H0H00.75H10.25

H1H0H0

Ви можете самостійно експериментувати з цим прикладом іграшки в R, ви також повинні спробувати різні абсолютні числа та комбінації голів та хвостів:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.