Я щойно переглянув лекцію про статистичний висновок ("порівняння пропорцій та засобів"), частину вступу до статистики онлайн-курсу. Матеріал мав менший сенс для мене, як це завжди (до цього часу я, мабуть, бачив цей матеріал десятки разів, розповсюджений протягом останніх трьох десятиліть).
Я шукаю книгу "Основні статистики-101" (оцінка балів, оцінка оцінки, статистичний висновок, тестування гіпотез, дизайн дослідження), яка серйозно сприймає проблему переконання скептичного читача ...
Нижче я наводжу кілька прикладів типу запитань, які автор, якого я шукаю, поставився б серйозно і знає, як правильно переконатись.
Але спершу дозвольте мені трохи наголосити, що в цій публікації я не задаю цих питань. Будь ласка, не відповідайте на них! Я наводжу їх лише як приклади і як "лакмусовий тест" (для типу автора пошуку).
Якщо "пропорція" - це просто середнє значення булевої змінної (тобто така, яка приймає лише значення 0 і 1), чому вчаться різні процедури для статистичного висновку з "пропорціями" та "засобами"?
Якщо нормальний розподіл настільки надійний, що припускаючи нормальність дає хороші результати навіть у тих випадках, коли ці дані не нормально розподіляються, і якщо t-розподіл настільки нормально виглядає, чому вся суєта щодо використання t-розподілу замість нормально?
Які саме "ступеня свободи", і чому ми їх турбуємо?
Що значить говорити про «істинного» значення параметра, враховуючи , що ми тільки з допомогою розподілів , які відбуваються з виглядати аналогічно даними?
Чим "аналіз дослідницьких даних" - це хороша річ, тоді як "перевірка даних" - це зло?
Як я вже говорив, мене турбує ставлення, яке має на увазі занедбаність таких питань. Я не хочу бачити того, хто мене щось навчає. Я шукаю авторів, які поважають скептицизм і раціональність читача, які знають, як їх вирішити (не обов'язково переходячи на сторінки та сторінки формалізмів та технічних питань).
Я усвідомлюю, що це високий порядок, і, можливо, особливо це стосується статистики. Тому я не сподіваюсь, що багато авторів у цьому досягнуть успіху. Але наразі я буду задоволений пошуком лише одного .
Дозвольте додати, що я не противник математики. Навпаки, я люблю математику. (Мені подобається аналіз [він же "розширене обчислення"], лінійна алгебра, теорія ймовірностей, навіть основна теорія вимірювань.)
Однак, на даний момент мій інтерес полягає у "прикладній", "практичній", "повсякденній", "реальній" статистиці (на відміну від теоретичних приємностей). (Але я також не хочу кулінарної книги!)
FWIW, я прочитав перші кілька розділів аналізу даних за допомогою регресії та багаторівневих / ієрархічних моделей Гельмана та Хілла, і мені подобається тон авторів. Їх спрямованість практична, але вникайте в теорію при необхідності. Вони також часто відступають і критично оцінюють стандартну практику та пропонують відверті думки, які апелюють до здорового глузду читача. На жаль, ці автори не написали книги, присвяченої цій темі, про яку я питаю в цій публікації ("Статистика 101", як описано вище). Я також знаю, що один з цих авторів (Гельман) є співавтором високо оціненого байєсівського аналізу даних , але, знову ж таки, це не те, що я зараз шукаю.
Редагувати:
Дікран Марсупіал висуває таке заперечення:
Я не думаю, що з нехтуванням питаннями нічого поганого не виникає, наступає момент, коли вирішення кожного питання ухиляється від викладу основних понять, що часто є більш важливим (особливо у статистиці 101 книги!).
Я з цим згоден. Для мене було б точніше сказати, що я шукаю "другий погляд на основні статистичні дані". Насправді, маючи мотивацію, я переглянув підручники, які використовувались на аспірантурах з висновку (скажімо), і виявив, що вони занадто нехтують питаннями, такими, як я перерахував. Якщо що-небудь, вони здаються ще менш схильними заглиблюватися в подібні питання (щоб вони могли зосередитись на таких питаннях, як умови для певної конвергенції - або - іншого цього - або - того…).
Проблема полягає в тому, що більш просунуті книги адресовані до радикально різної сукупності читачів - тієї, де "скептицизм сторонніх людей" різко вичерпався. IOW, ті, хто веде статистику випускників, минулого не турбують питання, які мене турбують. Вони вже не скептично ставляться до жодної речі. (Як вони пережили горб скептицизму? Можливо, деякі ніколи не були занадто критичними, особливо якщо вони дізналися свою статистику досить рано - я знаю, що я не був особливо критичним першокурсником, наприклад, хоча я цього не зробив то, можливо, в інших були вчителі, які заповнювали там, де їхні підручники не вистачали. Деякі, можливо, були досить розумні, щоб самі зрозуміти відповіді на такі запитання.