Я читаю слайди Джона Крушке "Аналіз даних байєсівських даних" , але насправді виникає питання щодо його інтерпретації t-тестів та / або всієї системи тестування значущості гіпотез. Він стверджує, що значення p не визначено, оскільки вони залежать від намірів слідчого.
Зокрема, він наводить приклад (сторінки 3-6) двох лабораторій, які збирають однакові набори даних, порівнюючи два способи лікування. Один лабораторій зобов’язується збирати дані від 12 суб'єктів (6 за умову), а інший збирає дані за фіксовану тривалість, що також дає 12 суб'єктів. Відповідно до слайдів, критичне значення для відрізняється між цими двома схемами збору даних: для першої, але для останньої. !
Повідомлення в блозі - якого я зараз не можу знайти - припускає, що сценарій з фіксованою тривалістю має більшу ступінь свободи, оскільки вони могли збирати дані від 11, 13 або будь-якої іншої кількості предметів, а сценарій з фіксованим N - визначення, має .
Чи не могли б мені хтось пояснити:
Чому критичне значення буде відрізнятися між цими умовами?
(Якщо припустити, що це питання) Як би ви могли виправити / порівняти ефекти різних критеріїв зупинки?
Я знаю, що встановлення критеріїв зупинки на основі значущості (наприклад, вибірка до ) може збільшити шанси помилки типу I, але це, схоже, не відбувається тут, оскільки жодне правило зупинки не залежить від результату аналіз.