Зрештою, якщо документ писав багато років і пройшов суворий експертний огляд, то, напевно, статистика буде непомічною?
Мій досвід читання праць, які намагаються застосувати статистику в найрізноманітніших сферах (політологія, економіка, психологія, медицина, біологія, фінанси, актуарна наука, бухгалтерський облік, оптика, астрономія та багато-багато інших) - це те, що якість статистичний аналіз може бути в будь-якому місці спектра - від чудового і добре зробленого до жахливих дурниць. Я бачив хороший аналіз у кожній із згаданих нами областей, і майже погано зроблений аналіз майже у всіх.
Деякі журнали, як правило, досить непогані, а деякі можуть бути більше схожі на гру в дартс із зав'язаними очима - ви можете отримати більшість із них не надто страшно далеко від мети, але їх буде кілька в стіні, підлозі та стелі. А може, кіт.
Я не планую називати жодних винуватців, але скажу, що я бачив академічну кар’єру, побудовану на неправомірному використанні статистики (тобто там, де ті самі помилки та непорозуміння повторювалися в папері після паперу, протягом більше десяти років).
Тому моя порада нехай читач остерігається ; не довіряйте, що редактори та рецензенти знають, що вони роблять. З часом ви можете зрозуміти, на яких авторів взагалі можна покластися, щоб вони не робили занадто шокуючого, а до яких слід ставитися особливо обережно. Ви можете зрозуміти, що деякі журнали зазвичай мають дуже високий рівень своєї статистики.
Але навіть типово хороший автор може помилитися, або арбітри та редактори не можуть зібрати помилки, які вони зазвичай можуть знайти; типово хороший журнал може публікувати виття.
[Іноді ви навіть побачите, як справді погані папери виграють призи чи нагороди ... що також не дуже говорить про якість людей, які судять про приз.]
Я не хотів би здогадуватися, яку частину "поганих" статистичних даних я міг бачити (в різних образах і на кожному етапі від визначення питання, дизайну дослідження, збору даних, управління даними, ... аж до аналіз та висновки), але це майже не мало для мене, щоб відчувати себе комфортно.
Я міг би вказати на приклади, але я не думаю, що це правильний форум для цього. (Було б добре, якби насправді був хороший форум для цього, але знову ж таки, він, швидше за все, досить швидко "політизується" і незабаром не зможе служити своєму призначенню.)
Я провів деякий час, ловлячись через PLOS ONE ... і знову, не збираючись вказувати на конкретні документи. Деякі речі, які я помітив: схоже, велика частка паперів має в них статистику, ймовірно, більше половини мають тести на гіпотези. Основна небезпека, як видається, чимало тестів, або з високим значенням як 0,05 на кожному (що автоматично не є проблемою, якщо ми розуміємо, що досить багато справді крихітних ефектів можуть виявитись як значні випадково), або неймовірно низький рівень індивідуальної значущості, який, як правило, дає низьку потужність. Я також бачив ряд випадків, коли близько півдесятка різних тестівαмабуть, застосовувались до вирішення точно такого ж питання. Це вражає мене загалом поганою ідеєю. Загалом стандарт був досить хорошим у кількох десятках паперів, але в минулому я там бачив абсолютно жахливий папір.
[Можливо, я міг би потурати лише одному прикладу, опосередковано. Це запитання задає питання про те, хто робить щось досить сумнівне. Це далеко не найгірше, що я бачив.]
З іншого боку, я також бачу (навіть частіше) випадки, коли люди змушені стрибати через усілякі непотрібні обручі, щоб прийняти їх аналіз; цілком розумні речі робити не приймаються, оскільки існує "правильний" спосіб робити речі за словами рецензента, редактора чи керівника, або просто у невимовній культурі певної області.