Я думаю, що це поєднання всього, що вже було сказано. Це дуже цікаві дані, і я не думав дивитись на подібні розподіли p-значення. Якщо нульова гіпотеза вірна, значення р буде однорідним. Але звичайно з опублікованими результатами ми не побачили б однаковості з багатьох причин.
Ми робимо дослідження, оскільки очікуємо, що нульова гіпотеза буде хибною. Тож нам слід частіше отримувати вагомі результати.
Якби нульова гіпотеза була помилковою лише половину часу, ми не отримали б рівномірного розподілу p-значень.
Проблема з ящиком файлів: Як згадувалося, ми боїмося подати папір, коли значення p не є значним, наприклад нижче 0,05
Видавці відхилять документ через незначні результати, навіть якщо ми вирішили надіслати його.
Коли результати будуть на кордоні, ми зробимо щось (можливо, не зі шкідливим наміром), щоб отримати важливе значення. (a) округніть до 0,05, коли значення p дорівнює 0,053, (b) знайдіть спостереження, які, на нашу думку, можуть бути пережилими, і після їх переміщення значення р падає нижче 0,05.
Я сподіваюся, що це підсумовує все, що було сказано досить зрозуміло.
Мені здається цікавим те, що ми бачимо значення p між 0,05 і 0,1. Якщо правила публікації повинні відхиляти що-небудь із значеннями p вище 0,05, правий хвіст відрізається на рівні 0,05. Це насправді було 0.10? якщо так, то, можливо, деякі автори та деякі журнали приймуть рівень значущості 0,10, але нічого вищого.
Оскільки у багатьох роботах є декілька p-значень (скоригованих на multiplcity чи ні), і папір прийнята, оскільки ключові тести були значущими, ми можемо побачити незначні p-значення, включені до списку. Це викликає питання "Чи були всі зведені p-значення в роботі включені до гістограми?"
Одним з додаткових спостережень є те, що спостерігається значна тенденція до зростання частоти опублікованих робіт, оскільки значення p стає значно нижче 0,05. Можливо, це є вказівкою авторів, що інтерпретують p-значення мислення p <0,0001, набагато гіднішого публікації. Я думаю, автор ігнорує або не усвідомлює, що значення p залежить стільки від розміру вибірки, скільки від величини ефекту.