Значення р - випадкова величина.
Під (принаймні, для статистики, що постійно розподіляється) р-значення повинно мати рівномірний розподілН0
Для послідовного тестування, під значення р повинно перевищувати 0 в межах, оскільки розміри вибірки збільшуються до нескінченності. Аналогічно, у міру збільшення розмірів ефектів розподіл p-значень також має тенденцію зміщуватися в бік 0, але він завжди буде "розповсюджений".Н1
Поняття "справжнього" р-значення для мене звучить як нісенітниця. Що б це означало, або під абоН0 ? Наприклад, ви можете сказати, що ви маєте на увазі "середнє значення розподілу p-значень при заданому розмірі ефекту та розмірі вибірки", але тоді в якому сенсі ви маєте конвергенцію, де спред повинен скорочуватися? Це не так, як ви можете збільшити розмір зразка, поки ви тримаєте його постійним.Н1
Ось приклад із одним зразком t-тестів та малим розміром ефекту при . Значення p майже однорідні, коли розмір вибірки невеликий, і розподіл повільно концентрується у напрямку 0, коли розмір вибірки збільшується.Н1
Ось саме так слід поводитись - для помилкової нулі, коли розмір вибірки збільшується, значення p повинні ставати більш концентрованими при низьких значеннях, але немає нічого, що дозволяє припустити, що розподіл значень, який він приймає, коли ви зробіть помилку типу II - коли значення р вище, ніж ваш рівень значущості, - якимось чином має бути "близьким" до рівня значущості.
α = 0,05
Часто корисно врахувати, що відбувається як з розподілом будь-якої тестової статистики, яку ви використовуєте в альтернативному варіанті, так і те, що застосувати cdf під нуль як перетворення до того, що буде робити з дистрибутивом (що дасть розподіл p-значення під конкретна альтернатива). Коли ви думаєте в цих термінах, часто не важко зрозуміти, чому така поведінка така.
Як я бачу, питання не стільки в тому, що взагалі є якась притаманна проблема з р-значеннями або тестуванням гіпотез, це скоріше випадок того, чи є тест гіпотези хорошим інструментом для вашої конкретної проблеми чи чи щось інше було б більш підходящим в будь-якому конкретному випадку - це не ситуація для широкої полеміки, але уважне розгляд виду питань, які стосуються тестів гіпотези та конкретних потреб вашої обставини. На жаль, ретельний розгляд цих питань проводиться рідко - занадто часто люди бачать питання форми "який тест я використовую для цих даних?" не зважаючи на те, що може бути питанням, що цікавить, не кажучи вже про те, чи є якийсь тест гіпотези хорошим способом вирішити його.
Одна з труднощів полягає в тому, що тести гіпотез одночасно широко розуміються та широко використовуються; люди дуже часто думають, що вони розповідають нам речі, яких вони не роблять. Значення р - це, мабуть, є найбільш неправильно зрозумілою річчю про тести гіпотез.