Інтервал довіри та P Невизначеність значення для тесту перестановки


12

Я зараз вивчаю тести рандомізації. Мені на думку спадають два питання:

  1. Так, легко та інтуїтивно зрозуміло, як р-значення обчислюється тестом рандомізації (на мою думку, це те саме, що і тест на перестановку?). Однак як ми могли також генерувати довірчий інтервал 95%, як це робимо при звичайних параметричних тестах?

  2. Коли я читаю документ з Університету Вашингтона про тести на перестановку , на сторінці 13 є речення, яке говорить:

    З 1000 перестановок ...., невизначеність біля p = 0,05 становить приблизно .±1%

    Цікаво, як ми отримуємо цю невизначеність.

Відповіді:


12

Однак як ми могли також генерувати довірчий інтервал 95%, як це робимо при звичайних параметричних тестах?

Ось один із способів ви можете генерувати інтервал із тесту на перекомпонування, хоча не завжди доречно вважати його довірчим інтервалом . Для конкретного прикладу візьміть тест на різницю в двох зразках у засобах. Розглянемо зміщення другої вибірки на (що може бути позитивним чи негативним). Тоді набір значень які призвели б до неприйняття тестом на рівні може використовуватися як номінальний інтервал довіри для різниці в засобах.δδα1α

Деякі автори (наприклад, [1], p364 і далі , [2]) називають інтервал, побудований таким чином (значення параметрів, які не відхиляються тестом), інтервал співзвучності - це краща назва, ніж інтервал довіри для нього (хоча багато людей просто ігнорують різницю; наприклад, я вважаю, що Кокс і Хінклі називають ці інтервали довіри), оскільки підхід не обов'язково дає інтервали, які мають бажане покриття (у багатьох ситуаціях можна побачити, що це повинно); назва передає щось про те, що вам говорить інтервал (інтервал значень, що відповідає даним).

Гельман включає обговорення того , чому іноді це може бути проблематично повсюдно вважають їх довірчі інтервали тут .

Хоча не важко дослідити покриття в рамках певних наборів припущень (за допомогою моделювання), і не бракує людей, які називають інтервали завантажувального інтервалу "інтервалами довіри" (навіть коли їх іноді не спостерігається як щось схоже на заявлене покриття).

Більш докладно про те, як це зробити у двох вибіркових випадках різниці в засобах, розглядаються в [3], де вони називаються інтервалами довіри рандомізації і там робиться твердження про те, коли вони точні (які твердження я не маю " t намагався оцінити).

З 1000 перестановок .... невизначеність біля р = 0,05 становить приблизно ± 1%.

Цікаво, як ми отримуємо цю невизначеність?

Розрахункове р-значення - пряма біноміальна пропорція. Таким чином, вона має таку саму стандартну помилку, як і будь-яка інша біноміальна пропорція, .p(1p)n

Отже, якщо і , стандартна похибка спостережуваної пропорції становить приблизно . ДІ буде [ Як альтернативи, становить близько стандартних помилок з кожного боку, що відповідало б довірчого інтервалу для базового р-значення трохи більше ]p=0.05n=10000.006990%±1.13%±1%1.4585%

Тож хоча б у грубому сенсі можна говорити про те, що невизначеність "близько 1%"

-

[1] Kempthorne and Folks (1971),
ймовірність, статистика та аналіз даних ,
Iowa State University Press

[2] LaMotte LR та Volaufová J, (1999),
"Інтервали прогнозування через інтервали консонансу",
журнал Королівського статистичного товариства. Серія D (Статистик) , Вип. 48, № 3, стор 419-424

[3] Ернст, MD (2004),
"Методи перестановки: основа точного умовиводу", Статистична наука , Вип. 19, № 4, 676–685

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.