Тестування значущості - це те, що придумав Фішер, а тестування гіпотез - це те, що Нейман та Пірсон придумали замінити тестування на значимість. Вони не однакові і взаємно несумісні в тій мірі, яка здивувала б більшість користувачів тестів з нульовою гіпотезою.
Тести значущості Фішера дають значення ap, яке представляє, наскільки екстремальні спостереження знаходяться під нульовою гіпотезою. Це значення p - це показник доказів проти нульової гіпотези та рівня значущості.
Тести гіпотез Неймана та Пірсона встановлюють як нульову гіпотезу, так і альтернативну гіпотезу і працюють як правило для прийняття нульової гіпотези. Коротко (тут є більше, ніж я можу сказати), ви вибираєте прийнятну швидкість помилкового позитивного висновку, альфа (як правило, 0,05), або приймаєте або відхиляєте нульове значення, залежно від того, чи значення p вище або нижче альфа. Вам потрібно дотримуватися рішення статистичного тесту, якщо ви хочете захистити від помилкових позитивних помилок.
Підхід Фішера дозволяє взяти до уваги все, що вам подобається, інтерпретуючи результат, наприклад, наявні докази можуть бути неофіційно враховані при інтерпретації та поданні результату. У NP-підході це може бути здійснено лише на етапі експериментального проектування, і, здається, це робиться рідко. На мою думку, рибальський підхід є кориснішим у базовій біонауковій роботі, ніж підхід НП.
Існує велика література про невідповідності між тестуванням значимості та тестуванням гіпотез та про нещасливу гібридизацію обох. Ви можете почати з цієї статті: Гудман, До медичної статистики, заснованої на доказах. 1: Помилковість P значення.
http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=ShowDetailView&TermToSearch=10383371