Використовуючи завантажувальний інструмент, я обчислюю p значення значень тестів за допомогою двох методів:
- перекомпонування під нульовою гіпотезою та підрахунок результатів принаймні настільки ж крайній, як і результат, отриманий з оригінальних даних
- перекомпонування за альтернативною гіпотезою та підрахунок результатів принаймні таким самим віддаленим від початкового результату, як значення, що відповідає нульовій гіпотезі
Я вважаю, що перший підхід є цілком правильним, оскільки він відповідає визначенню значення ap. Я менш впевнений у другому, але він зазвичай дає дуже схожі результати і нагадує мені тест Вальда.
Чи правий я? Чи обидва методи правильні? Чи однакові вони (для великих зразків)?
Приклади двох методів (правки після запитань DWin та відповіді Еріка):
Приклад 1. Побудуємо тест завантажувальної програми, аналогічний двом зразкам Т-тесту. Спосіб 1 буде перепробовано з одного зразка (отриманий об'єднанням початкових двох). Спосіб 2 буде відтворений з обох зразків незалежно.Приклад 2. Побудуємо тест завантажувальної кореляції кореляції між xₐ… xₐ та y₁… yₐ. Спосіб 1 передбачає відсутність кореляції та повторної вибірки, що передбачає (xₑ, yₔ) пар, де e ≠ ə. Метод 2 складе зразок завантажувальної програми з оригінальних пар (x, y).
Приклад 3. Побудуємо тест завантаження, щоб перевірити, чи справедлива монета. Метод 1 створить випадкові вибірки, встановивши Pr (голова) = Pr (хвіст) = ½. Метод 2 дозволить повторно пробити вибірку експериментальних значень голови / хвоста та порівняти пропорції до ½.