Висновок для скептичного (але не проти математичного) читача


14

Я щойно переглянув лекцію про статистичний висновок ("порівняння пропорцій та засобів"), частину вступу до статистики онлайн-курсу. Матеріал мав менший сенс для мене, як це завжди (до цього часу я, мабуть, бачив цей матеріал десятки разів, розповсюджений протягом останніх трьох десятиліть).

Я шукаю книгу "Основні статистики-101" (оцінка балів, оцінка оцінки, статистичний висновок, тестування гіпотез, дизайн дослідження), яка серйозно сприймає проблему переконання скептичного читача ...

Нижче я наводжу кілька прикладів типу запитань, які автор, якого я шукаю, поставився б серйозно і знає, як правильно переконатись.

Але спершу дозвольте мені трохи наголосити, що в цій публікації я не задаю цих питань. Будь ласка, не відповідайте на них! Я наводжу їх лише як приклади і як "лакмусовий тест" (для типу автора пошуку).

  1. Якщо "пропорція" - це просто середнє значення булевої змінної (тобто така, яка приймає лише значення 0 і 1), чому вчаться різні процедури для статистичного висновку з "пропорціями" та "засобами"?

  2. Якщо нормальний розподіл настільки надійний, що припускаючи нормальність дає хороші результати навіть у тих випадках, коли ці дані не нормально розподіляються, і якщо t-розподіл настільки нормально виглядає, чому вся суєта щодо використання t-розподілу замість нормально?

  3. Які саме "ступеня свободи", і чому ми їх турбуємо?

  4. Що значить говорити про «істинного» значення параметра, враховуючи , що ми тільки з допомогою розподілів , які відбуваються з виглядати аналогічно даними?

  5. Чим "аналіз дослідницьких даних" - це хороша річ, тоді як "перевірка даних" - це зло?

Як я вже говорив, мене турбує ставлення, яке має на увазі занедбаність таких питань. Я не хочу бачити того, хто мене щось навчає. Я шукаю авторів, які поважають скептицизм і раціональність читача, які знають, як їх вирішити (не обов'язково переходячи на сторінки та сторінки формалізмів та технічних питань).

Я усвідомлюю, що це високий порядок, і, можливо, особливо це стосується статистики. Тому я не сподіваюсь, що багато авторів у цьому досягнуть успіху. Але наразі я буду задоволений пошуком лише одного .

Дозвольте додати, що я не противник математики. Навпаки, я люблю математику. (Мені подобається аналіз [він же "розширене обчислення"], лінійна алгебра, теорія ймовірностей, навіть основна теорія вимірювань.)

Однак, на даний момент мій інтерес полягає у "прикладній", "практичній", "повсякденній", "реальній" статистиці (на відміну від теоретичних приємностей). (Але я також не хочу кулінарної книги!)

FWIW, я прочитав перші кілька розділів аналізу даних за допомогою регресії та багаторівневих / ієрархічних моделей Гельмана та Хілла, і мені подобається тон авторів. Їх спрямованість практична, але вникайте в теорію при необхідності. Вони також часто відступають і критично оцінюють стандартну практику та пропонують відверті думки, які апелюють до здорового глузду читача. На жаль, ці автори не написали книги, присвяченої цій темі, про яку я питаю в цій публікації ("Статистика 101", як описано вище). Я також знаю, що один з цих авторів (Гельман) є співавтором високо оціненого байєсівського аналізу даних , але, знову ж таки, це не те, що я зараз шукаю.

Редагувати:

Дікран Марсупіал висуває таке заперечення:

Я не думаю, що з нехтуванням питаннями нічого поганого не виникає, наступає момент, коли вирішення кожного питання ухиляється від викладу основних понять, що часто є більш важливим (особливо у статистиці 101 книги!).

Я з цим згоден. Для мене було б точніше сказати, що я шукаю "другий погляд на основні статистичні дані". Насправді, маючи мотивацію, я переглянув підручники, які використовувались на аспірантурах з висновку (скажімо), і виявив, що вони занадто нехтують питаннями, такими, як я перерахував. Якщо що-небудь, вони здаються ще менш схильними заглиблюватися в подібні питання (щоб вони могли зосередитись на таких питаннях, як умови для певної конвергенції - або - іншого цього - або - того…).

Проблема полягає в тому, що більш просунуті книги адресовані до радикально різної сукупності читачів - тієї, де "скептицизм сторонніх людей" різко вичерпався. IOW, ті, хто веде статистику випускників, минулого не турбують питання, які мене турбують. Вони вже не скептично ставляться до жодної речі. (Як вони пережили горб скептицизму? Можливо, деякі ніколи не були занадто критичними, особливо якщо вони дізналися свою статистику досить рано - я знаю, що я не був особливо критичним першокурсником, наприклад, хоча я цього не зробив то, можливо, в інших були вчителі, які заповнювали там, де їхні підручники не вистачали. Деякі, можливо, були досить розумні, щоб самі зрозуміти відповіді на такі запитання.


2
Більшість із цих питань - на ті, на які ми не повинні відповідати, - мають хороші відповіді вже тут у резюме. Деякі з цих питань навіть мають досить тривіальні відповіді. Але є тисячі питань люди придумують під час будь-якої теми - ви ніколи не збираєтеся знайти пояснення , яке охоплює всі можливі питання, ні ви не знайдете той , який просто чекає тільки ті конкретні питання , які ви є в той час як ви дивитеся або читання. Добре, ви можете потрапити один-два випадково, але загалом це неможливо. Чому б просто не поставити запитання, коли вони виникають? На сайті, який відповідає на запитання?
Glen_b -Встановити Моніку

2
Я скажу, що подібні запитання виникають, коли люди роблять статистику (а деякі книги відповідають на деякі з них), але більшість з них не є актуальними питаннями, пов’язаними зі скептицизмом - в основному це прості питання з розумінням. наприклад, "що таке ступінь свободи і чому нас хвилює" взагалі не скептично, це вимагає ясності пояснень та мотивації. Причини, чому передові користувачі статистики не турбуються про це, тому що вони вже розуміють, чому вони такі цінні.
Glen_b -Встановити Моніку

Відповіді:


6

Ви вже отримали кілька хороших пропозицій. Ось ще кілька. По-перше, іноді обговорюються два блоги, які я читаю епізодично, і де такі питання, як ти собі задаєш, обговорюються. Оскільки вони є блогами, ви навіть можете задати питання та отримати дуже хороші відповіді! Ось вони приходять:

http://andrewgelman.com/ (Ендрю Гельман)

http://errorstatistics.com/ (Дебора Майо)

І кілька книжок, які я думаю, допоможуть вам: Box, Hunter & Hunter: Статистика для експериментаторів.

Як зазначається в заголовку, це ("перший", але насправді, справді ... другий) курс для людей, які хотіли б розробити свої власні експерименти і так проаналізувати їх. Дуже високо в частині "чому".

Потім: Д. Р. Кокс: Принципи статистичного висновку, ще одна дуже хороша книга про "чому" не "як".

І оскільки ви запитуєте, чому засоби та пропорції трактуються по-різному, ось книга, яка цього не робить: http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = книги & тобто = UTF8 & qid = 1373395118 & sr = 1-1 & ключові слова = звільнений + статистика

Мало математики, високо на принципах.


8

Я скоріше сумніваюся, що з’явиться одна книга, яка підходить вам, оскільки окремі люди схильні до різних речей, а книги написані для цільової аудиторії, а не для окремих людей. Це одне з хороших речей щодо того, як ви навчаєтесь людині, а не просто книга, а це те, що ви можете ставити запитання під час руху. Це досить складно зробити в лінійному тексті.

Я не думаю, що з нехтуванням питаннями нічого поганого не виникає, наступає момент, коли вирішення кожного питання ухиляється від викладу основних понять, що часто є більш важливим (особливо у статистиці 101 книги!).

Я підозрюю, що найкращий підхід - це отримати хорошу книгу, а потім шукати відповідь на невирішені питання в інших місцях. Я маю перед собою книжкову полицю, наповнену текстами статистики, просто тому, що жоден з них не є ізольованим - це все, що мені потрібно (навіть не книга Джейнеса; o).

Для абсолютного початківця я вважаю, що книга Гранта Фостера "Розуміння статистики" - це гарне місце для початку, але я підозрюю, що в цьому випадку це занадто просто.


1
"Я не думаю, що з нехтуванням питаннями обов'язково щось не так". Я думаю, що це справедливе заперечення; Я додав редагування до своєї публікації, щоб вирішити цю проблему.
kjo

7

XΘXΘΘXtXΘ


5
+1 значна частина причини, чому статистичні процедури видаються сумнівними, полягає в тому, що вони є досить протиінтуїтивними, а історична оцінка того, як статистика закінчилася так, як є, є, мабуть, хорошим підходом для скептиків.
Дікран Марсупіал

2
@DikranMarsupial: Насправді я прочитав "Історію статистики" Стіглера саме для того, щоб опинитися в глибині моїх труднощів зі статистикою. І це дещо допомогло. На жаль, це залишає більшу частину епохи Фішера проти Неймана, коли (я підозрюю) значна частина викривленої химерності виникла. Я спробував близько 50 сторінок книги Гальда, але виявив, що його виведення неможливо прослідкувати: вони були чітко адресовані читачам зі значною статистичною експертизою ... Подумайте про це, я вважаю, що книга адресована освіченому мирянину під назвою "Чому статистика така дивна? " продавав би добре ... :)
kjo

4
ІМХО контрінтуїтивність статистики заздалегідь ставиться до епохи Фішера проти Неймана (хоча інтуїтивність не передбачає корисності чи навпаки). Книги Йена Хекінга, можливо, варто спробувати, мені сподобалось "Виникнення ймовірності". Мені статистика Баєса набагато простіше зрозуміти концептуально, ніж частофілістська статистика, але набагато складніше виконати на практиці. Розуміння відмінностей між баєсівським та частолістським підходами мені дуже допомогло в розумінні частолістського підходу.
Дікран Марсупіал

1
Дякую, я перевірю Злом. Його книги вже давно приглядаються до мене, хоча я відклав його читати, думаючи, що він більше зосереджений на філософії теорії ймовірностей (предмет, який я вважаю захоплюючим сам по собі). Зважаючи на це, я визнаю, що хоча б кілька моїх проблем зі статистикою, що впливають на тлумачення ймовірності, тому, можливо, читання Хакінгу подбає про хоча б деякі мої заперечення.
kjo

2
@kjo Я прочитав " Логіку статистичних виводів" Хакінга і виявив це дуже "філософським" - він висунувся на ідею ймовірності як "підтримки" і на Неймана-Пірсона, але продовжував працювати з простими прикладами - не обговорював параметри неприємності, мульти -визначення параметрів або щось складне (якщо я не забув). Варто прочитати, звичайно, але я б не рекомендував це починати.
Scortchi

6

Абелсон (1995), " Статистика як принциповий аргумент" є вступним і цікавим є питання щодо деяких питань, які часто бентежать учнів.

Але, можливо, вам просто потрібно прочитати кілька книг з теоретичної статистики (пропускаючи всі відомості про конвергенцію, метричні простори та ін.) І навіть якщо вони не відповідають на конкретні запитання, як ваші приклади, ви зможете відповісти на більшість їх самі, а шукайте решту, як пропонує @Dikran.

Я запропонував в іншій темі прочитати Кокс і Хінклі, Теоретичну статистику або Кокс, Принципи статистичних виводів разом з Каселлою та Бергером, Статистичні умовиводи, щоб зрозуміти різні перспективи.


1
Мені це здалося цікавим, але я не думаю, що це взагалі на рівні, який очікує ОП.
Гала

@Gael Ви, мабуть, праві, особливо з огляду на редагування.
Scortchi
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.