Наступний уривок із статті: Які відмінності між однохвостими та двохвостими тестами? , на довідковому сайті UCLA зі статистикою.
... розглянути наслідки відсутності ефекту в іншому напрямку. Уявіть, що ви розробили новий препарат, який, на вашу думку, є покращенням порівняно з існуючим препаратом. Ви хочете максимально покращити свою здатність виявляти поліпшення, тому ви вибрали тест з однохвостим покриттям. Роблячи це, ви не зможете перевірити можливість того, що новий препарат є менш ефективним, ніж існуючий препарат.
Після вивчення абсолютних основ тестування гіпотез і переходу до частини про один проти двох хвостих тестів ... Я розумію основну математику та підвищену здатність до виявлення одного хвостового тесту тощо ... Але я просто не можу обернутись навколо голови навколо одного ... Який сенс? Я дійсно не розумію, чому ви повинні розділити альфа між двома крайнощами, коли результат вибірки може бути лише в одній або іншій, або ні в одній.
Візьмемо приклад сценарію з цитованого тексту вище. Як ви могли, можливо, "не пройти перевірку" на результат у зворотному напрямку? Ви маєте середню вибірку. У вас середнє населення. Проста арифметика підказує, що вище. Що є для тестування чи не для тестування у зворотному напрямку? Що заважає тобі тільки починати з нуля з протилежною гіпотезою, якщо ти чітко бачиш, що середня вибірка відступає в іншому напрямку?
Ще одна цитата з тієї ж сторінки:
Вибір тесту з однохвостим після запуску тесту з двома хвостами, який не зміг відкинути нульову гіпотезу, не є доцільним, незалежно від того, наскільки "близьким" до значущого був тест з двома хвостами.
Я припускаю, що це стосується також перемикання полярності вашого односхилого тесту. Але наскільки цей "докторізований" результат менш достовірний, ніж якби ви в першу чергу просто обрали правильний односхилий тест?
Ясна річ я пропускаю тут велику частину картини. Все це здається занадто довільним. Що це, я думаю, в тому сенсі, що те, що позначає "статистично значиме" - 95%, 99%, 99,9% ... Почнемо з довільного.