Під час навчання курсу моєї статистики я намагався зрозуміти різницю між тестами гіпотез з однохвостими і двохвостими. Зокрема, чому однобічний тест відкидає нуль, тоді як двохвостий - не?
Приклад:
Під час навчання курсу моєї статистики я намагався зрозуміти різницю між тестами гіпотез з однохвостими і двохвостими. Зокрема, чому однобічний тест відкидає нуль, тоді як двохвостий - не?
Приклад:
Відповіді:
Два тестові тести на різницю в будь-якому напрямку. Таким чином, значення P було б площею під розподілом t праворуч від t = 1,92 PLUS, площа під розподілом ліворуч від t = -1,92. Це вдвічі більше площі, ніж тест з однохвостим, і тому значення P вдвічі більше.
Якщо ви користуєтесь тестом з односхилими руками, ви отримуєте потужність, але за рахунок потенційної вартості ігнорувати різницю, яка знаходиться в зворотному напрямку, ніж гіпотеза до отримання даних. Якщо ви отримали дані до того, як ви формалізували та записали гіпотезу, вам дійсно слід скористатись двосхилим тестом. Так само, якщо ви зацікавились ефектом в будь-якому напрямку, ви використовуєте тест з двома хвостами. Насправді, ви можете використовувати тест з двома хвостами як підхід за замовчуванням і використовувати лише тест з однохвостим у незвичному випадку, коли ефект може існувати лише в одному напрямку.
Площа під кривою не вдвічі більша для тесту з двома хвостами: Для тесту з двома хвостами з критичним значенням p = .05 ви випробовуєте, як часто спостережувані дані можна отримати з нижнього або верхнього 2,5% від нульового розподілу ( .05 всього). За допомогою тесту на 1 кінець ви перевіряєте, як часто дані надходять із крайніх 5% хвоста одного (заздалегідь вказаного) хвоста.
Частково відповідь на ваше запитання є однією з практик: Більшість дослідників вважають експерименти, які повідомляють про односхилі тести, як малоймовірні для повторення (тобто, вони припускають, що дослідник обрав це, щоб стати їх статистикою "значущою").
Однак є дійсні випадки використання. Якщо ви знаєте, що будь-який результат у зворотному напрямку неможливий у рамках випробуваної теорії, то, як зазначалося в попередньому коментарі, ви можете вказати це достроково і провести тест з однократкою. Більшість людей, знову ж таки, все-таки сприйматимуть це уважно.
Це призводить до питання: навіщо використовувати різні статистичні дані тесту? Причина полягає в тому, що альтернативи різні, тому сила кожної статистики тесту різна. Зокрема, потужність кожного тесту зменшується (за умови використання однакової значимості), якщо ми використовуємо статистику тесту та область відхилення від іншого тесту.