Я сказав би це просто, оскільки тестування гіпотез нульової реальності стосується лише нульової гіпотези. І взагалі нульова гіпотеза зазвичай не є цікавою, і навіть не може бути "статус-кво" - особливо в регресійному тестуванні гіпотез. Часто в суспільній науці не існує статусу кво, тому нульова гіпотеза може бути досить довільною. Це робить величезну різницю в аналізі, оскільки вихідна точка не визначена, тому різні дослідження починаються з різної нульової гіпотези, швидше за все, виходячи з усіх наявних у них даних. Порівняйте це з чимось на кшталт законів руху Ньютона - має сенс мати це як нульову гіпотезу, і спробуйте знайти кращі теорії з цієї вихідної точки.
Крім того, p-значення не обчислюють правильної ймовірності - ми не хочемо знати про ймовірність хвоста, якщо тільки альтернативна гіпотеза не є більшою ймовірністю під час просування далі в хвости. Те, що ви насправді хочете, це те, наскільки добре теорія передбачає те, що насправді було побачене. Наприклад, припустимо, я прогнозую, що існує 50% шансів на "легкий душ", а мій конкурент прогнозує, що шанс на 75% є. Це виявляється правильним, і ми спостерігаємо легкий злив. Тепер, коли вирішуєте, яка людина погода правильна, ви не повинні давати моєму передбаченню додаткового кредиту за те, що також даєте 40% шансу на "грозу", або брати кредит у мого конкурента за надання "грози" шансу 0%.
Трохи замислившись над цим, вам покаже, що не стільки, скільки дана теорія підходить до даних, а більше про те, наскільки погано підходить будь-яке альтернативне пояснення. Якщо ви працюєте з коефіцієнтами Бейса , у вас є попередня інформація , дані та деяка гіпотеза , коефіцієнт Байєса задається:IDH
BF=P(D|HI)P(D|H¯¯¯¯¯I)
Якщо дані неможливо , враховуючи , що помилково, то , і ми стали деякі з . Значення р зазвичай дає чисельник (або деяке його наближення / перетворення). Але зауважте також, що невелике р-значення є лише доказом проти нуля, якщо існує альтернативна гіпотеза, яка відповідає даним. Ви можете вигадати ситуації, коли p-значення насправді підтримує нульову гіпотезу - це дійсно залежить від альтернативи.HBF=∞H0.001
Є добре відомий емпіричний приклад, що легко розуміється, коли монета кидається в разів, а кількість голів - - трохи більше половини. Нульовою моделлю є а альтернативою є та для граничної моделі (DU = дискретна рівномірність). Значення p для нульової гіпотези дуже мало , тому відхиліть нуль і опублікуйте правильно? Але подивіться на коефіцієнт Баєса, заданий:104,490,00052,263,471y∼Bin(n,0.5)y|θ∼Bin(n,θ)θ∼U(0,1)p = 0,00015y∼BetaBin(n,1,1)∼DU(0,…,n)p=0.00015
BF=(ny)2−n1n+1=(n+1)!2ny!(n−y)!=11.90
Як це може бути? Фактор Байєса підтримує нульову гіпотезу, незважаючи на малу p-величину? Ну, подивіться на альтернативу - вона дала ймовірність для спостережуваного значення - альтернатива не дає хорошого пояснення фактам - тому нуль швидше, але лише відносно альтернативи . Зауважте, що нуль лише трохи кращий за цей - . Але це все-таки краще, ніж альтернатива.1n+1=0.00000000960.00000011
Особливо це стосується прикладу, який критикує Гельман - там ніколи не було протестовано лише однієї гіпотези, і не надто багато роздумів над тим, а) які пояснення альтернативних варіантів (особливо щодо заплутаності та ефектів, які не контролюються); b) на скільки альтернативи, підкріплені попередніми дослідженнями, і головне, в) які прогнози вони роблять (якщо такі є), які суттєво відрізняються від нульових?
Але зауважимо, що не визначено, і в основному представляє всі інші гіпотези, що відповідають попередній інформації. Єдиний спосіб, коли ви справді можете зробити тестування гіпотез правильно, вказавши коло альтернатив, які ви збираєтесь порівнювати. І навіть якщо ви зробите це, скажімо, у вас є , ви можете повідомити лише про те, що дані підтримують щодо того, що ви вказали. Якщо ви залишите важливу гіпотезу з набору альтернатив, ви можете розраховувати на отримання безглуздих результатів. Крім того, дана альтернатива може виявитись набагато кращою, ніж інші, але все ще малоймовірною. Якщо у вас є один тест, де р-значенняH¯¯¯¯¯H1,…,HKHk0.01але сто різних тестів, де р-значення дорівнює , набагато ймовірніше, що "найкраща гіпотеза" (найкраща має кращі конотації, ніж істинна) насправді виходить із групи "майже значущих" результатів.0.1
Основним моментом підкреслюється те, що гіпотеза ніколи не може існувати у відриві від альтернативних засобів. Тому що, вказавши теорій / моделей, ви завжди можете додати нову гіпотезу
Насправді цей тип гіпотез - це в основному те, що прогресує наука - хтось має нову ідею / пояснення якогось ефекту, а потім тестує цю нову теорію на тлі поточного набору альтернатив . Його проти а не просто проти . Спрощена версія застосовується лише тоді, коли є дуже сильно підтримувана гіпотеза вH K + 1 = Щось ще, про що ще не думали H K + 1 H 1 , … , H K H 0 H A H 1 , … , H KK
HK+1=Something else not yet thought of
HK+1H1,…,HKH0HAH1,…,HK- тобто з усіх ідей та пояснень, які ми маємо на даний момент, існує одна домінуюча теорія. Це, безумовно, не стосується більшості напрямків соціальної / політології, економіки та психології.