Різниця між тестуванням з однохвостим і двохвостим?


13

Під час навчання курсу моєї статистики я намагався зрозуміти різницю між тестами гіпотез з однохвостими і двохвостими. Зокрема, чому однобічний тест відкидає нуль, тоді як двохвостий - не?

Приклад:

різниця між тестами з однохвостими і двохвостими гіпотезами


Зауважте, що ви відхиляєте лише певний рівень значущості. Ви все одно можете відкинути обидві гіпотези, підвищивши рівень значущості до 10%. ви також не зможете відхилити обидва, якщо ви знизили рівень значущості до 1%.
ймовірністьлогічний

Відповіді:


11

Два тестові тести на різницю в будь-якому напрямку. Таким чином, значення P було б площею під розподілом t праворуч від t = 1,92 PLUS, площа під розподілом ліворуч від t = -1,92. Це вдвічі більше площі, ніж тест з однохвостим, і тому значення P вдвічі більше.

Якщо ви користуєтесь тестом з односхилими руками, ви отримуєте потужність, але за рахунок потенційної вартості ігнорувати різницю, яка знаходиться в зворотному напрямку, ніж гіпотеза до отримання даних. Якщо ви отримали дані до того, як ви формалізували та записали гіпотезу, вам дійсно слід скористатись двосхилим тестом. Так само, якщо ви зацікавились ефектом в будь-якому напрямку, ви використовуєте тест з двома хвостами. Насправді, ви можете використовувати тест з двома хвостами як підхід за замовчуванням і використовувати лише тест з однохвостим у незвичному випадку, коли ефект може існувати лише в одному напрямку.


Дякую за Ваш коментар, Майкл. Ось що я не розумію: як площа під кривою може бути вдвічі більшою для двосхилого тесту? Чи не повинен P бути однаковим в обох випадках, оскільки альфа = 0,05?
Lu Ci

альфа, у вашому питанні, - це лише ваше обмеження для прийняття рішення про те, що означає p-значення (відхилити нуль чи ні). Отже, це не впливає на значення р.
Іоанн

Трохи прискіпливий, але думка про те, що вам потрібно вибрати гіпотезу перед тим, як побачити дані, не потрібна. Можна зробити два однобічні тести. Ви завжди будете відхиляти напрямок, не сприятливий для даних. Таким чином, є сенс перейти до одностороннього тесту, якому надають перевагу дані.
ймовірністьлогічний

1
@probabilityislogic - Я цілком погоджуюся, за винятком випадків, коли потрібно, щоб значення альфа відображало фактичну тривалу помилкову позитивну помилку (тобто хоче використовувати підхід Неймана-Пірсона). Якщо ви використовуєте односторонній тест і вирішите напрямок зміни для тестування на основі спостережуваного ефекту, то ви отримаєте рівно вдвічі більше помилкових позитивних результатів, ніж передбачає ваш альфа-рівень.
Майкл Лев

Це лише тривалий рівень помилок для тих, хто продовжує ігнорувати попередні дані. Це не гарний спосіб досягти хороших довгострокових результатів. рівень помилок, заданий за значимістю, перевищує всі набори даних, які ми могли спостерігати один раз .
ймовірністьлогічного

5

Площа під кривою не вдвічі більша для тесту з двома хвостами: Для тесту з двома хвостами з критичним значенням p = .05 ви випробовуєте, як часто спостережувані дані можна отримати з нижнього або верхнього 2,5% від нульового розподілу ( .05 всього). За допомогою тесту на 1 кінець ви перевіряєте, як часто дані надходять із крайніх 5% хвоста одного (заздалегідь вказаного) хвоста.

Частково відповідь на ваше запитання є однією з практик: Більшість дослідників вважають експерименти, які повідомляють про односхилі тести, як малоймовірні для повторення (тобто, вони припускають, що дослідник обрав це, щоб стати їх статистикою "значущою").

Однак є дійсні випадки використання. Якщо ви знаєте, що будь-який результат у зворотному напрямку неможливий у рамках випробуваної теорії, то, як зазначалося в попередньому коментарі, ви можете вказати це достроково і провести тест з однократкою. Більшість людей, знову ж таки, все-таки сприйматимуть це уважно.


1

S(D)RR

S(D)=|т||т|>т0т0αS(D)=тт>т1т1Пr(|т|>т0|Н0)Пr(т>т0|Н0)т0т1

Це призводить до питання: навіщо використовувати різні статистичні дані тесту? Причина полягає в тому, що альтернативи різні, тому сила кожної статистики тесту різна. Зокрема, потужність кожного тесту зменшується (за умови використання однакової значимості), якщо ми використовуємо статистику тесту та область відхилення від іншого тесту.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.