Я підозрюю, що більшість користувачів статистичних інструментів є допоміжними користувачами (люди, які майже не мали офіційного навчання статистиці). Для дослідників та інших фахівців дуже спокусливо застосовувати статистичні методи до своїх даних просто тому, що вони бачили це "зроблено раніше" у рецензованих роботах, сірій літературі, в Інтернеті або на конференції. Однак, без чіткого розуміння необхідних припущень та обмежень статистичного інструменту може призвести до помилкових результатів - помилки часто не визнаються!
Я вважаю, що студенти магістрантів (особливо з соціальних та природничих наук) або не знають про статистичні підводні камені, або вважають ці підводні камені несуттєвими (останній найчастіше трапляється). Хоча приклади неналежного використання статистичних інструментів можна знайти у багатьох вступних текстових книгах, Інтернеті чи StackExchange, мені важко знайти приклади реального світу, які мали б згубні результати (наприклад, вартість у доларах США, постраждала життя та втрачена кар'єра) . З цією метою я шукаю приклади реального світу, які висвітлюють неправильне використання статистичних методів, для яких:
- Застосовувані статистичні методи, як правило, висвітлюються у вступних курсах статистики (тобто інфекційна статистика, регресія тощо).
- кінцевий результат мав дорогі наслідки (втрачені долари, загроза життю, зрушення кар'єри тощо)
- ці дані легко доступні для використання в якості робочих прикладів в курсі (мета полягає в тому, щоб студенти працюють через реальні приклади , які мали реальні наслідки світу.)
Один нестатистичний приклад, який я люблю наводити студентам, обговорюючи важливість правильного визначення одиниць у дослідницькому проекті, - це «метрична невідповідність», яка призвела до втрати супутника в 125 мільйонів доларів! Зазвичай це викликає: - фактор від студентів і, здається, справляє стійке враження (принаймні протягом їхнього короткого академічного життя).