Перевірка обґрунтованості: наскільки низьким може бути показник p?


24

Я використовую тест ranksum для порівняння медіани двох зразків ( ) та виявили , що вони значно відрізняються з: . Чи варто мені підозрювати таке невелике -значення чи слід віднести його до високої статистичної потужності, пов'язаної з наявністю дуже великої вибірки? Чи є така річ, як підозріло низький -значення?p pn=120000p = 1.12E-207pp


Відповіді:


30

Значення P на стандартних комп'ютерах (з використанням плавців подвійної точності IEEE) можуть досягати приблизно . Це можуть бути справедливі правильні обчислення, коли розміри ефекту великі та / або стандартні помилки низькі. Ваше значення, якщо обчислюватися з Т або нормальним розподілом, відповідає розміру ефекту приблизно 31 стандартної помилки. Пам’ятаючи, що стандартні помилки зазвичай масштабуються із зворотним квадратним коренем , що відображає різницю менше 0,09 стандартних відхилень (якщо вважати, що всі вибірки є незалежними). У більшості застосувань не було б нічого підозрілого чи незвичного в такій різниці.10303n

Інтерпретація таких p-значень - інша справа. Перегляд числа, розміром як або навіть оскільки ймовірність перевищує межі розуму, враховуючи всі способи, за якими реальність, можливо, відхилиться від моделі ймовірності, яка лежить в основі цього p- розрахунок величини. Хороший вибір - повідомити, що значення р є меншим за найменший поріг, який ви вважаєте, що модель може розумно підтримувати: часто від до . 10 - 10 0,01 0,00011020710100.010.0001


13
Коли я повідомив про '' '' в доповіді про конференцію, рецензент сказав мені, що я повинен змінити його на '' '', щоб дотримуватися вказівок APA. p < 0,001p<1026p<0.001
Томас Левін

4
@whuber - прекрасно сказано.
rolando2

2
(+1) У якийсь момент більш ймовірно, що уряд віддалено перегортає біти у вашій ОЗУ за допомогою технології супер-шпигуна ...
JMS,

4
(+1) Ви дійсно можете опуститися трохи нижче в плаваючої точки подвійної точності IEEE. Але ваші числові процедури для обчислення р- значень майже до цього часу гарантовано розпадаються. Якщо ви напевно не знаєте, що ваші припущення щодо моделювання є абсолютно правильними (а коли вони є?), P -значення з часом стає просто мірою розміру вибірки, як тільки зразок набуває достатньо великих розмірів. 5×10324pp
кардинал

1
@ Cardard, ми обидва помиляємось щодо меж: крім денормалізованих значень, найменший подвійний IEEE - це приблизно , що відповідає десяти бітам для показника бази-2. 10308
whuber

16

Немає нічого підозрілого - надзвичайно низькі значення p, як ваше, досить поширені, коли розміри вибірки великі (як і для порівняння медіанів). Як було сказано, звичайно, такі р-значення повідомляються як такі, що менші за деякий поріг (наприклад, <0,001).

Слід бути обережним, це те, що значення р лише підказує, чи є різниця в медіані статистично достовірною. Чи є різниця достатньо значною за величиною, вам доведеться вирішити: наприклад, для великих наборів зразків надзвичайно малі відмінності в засобах / медіанах можуть бути статистично значущими, але це може означати не дуже багато.


3

Значення р може досягти значення 0.

θH0:θ=1X=1.1

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.