Чому слід навчитись спочатку: ймовірність чи статистика?


19

Я нещодавно приєднався як викладач кафедри математики. відомої установи. Я буду викладати курс Імовірність та Статистика на рівні бакалаврату. У закладі вже є навчальний план для цього курсу, яким я не дуже задоволений. У цьому навчальному плані спочатку висвітлюється статистика, також відсутня частина оцінки. Я завжди думав, що основ імовірності слід навчати перед викладанням статистики. Може хтось з цього приводу дасть якусь думку? Також дуже цінується пропозиція щодо тем, які слід висвітлити в такому курсі.


3
Мені здається, що для розуміння логіки та інтуїції статистичних прийомів необхідне базове розуміння (не обов'язково занадто матових понять) ймовірності, про що свідчить той факт, що більшість книг статистики елементарного рівня починаються з вірогідності. У моєму бізнесі з нижчого класу, нас спочатку навчали ймовірності, а потім статистиці.
rsl

4
Це теоретична чи прикладна статистика ..? Значну частину застосованої статистики можна продумати без детального введення до ймовірності. Пізніше це також може бути приємним апетитом для ймовірності та теоретичної статистики. Тож це не повинно бути такою поганою ідеєю.
Тім

3
Яку ступінь програми (ів) виконують студенти? Це математичні спеціальності, чи модуль пропонується в основному студентам з інших факультетів, наприклад соціології чи бізнесу?
Роберт Лонг

@RobertLong: Кажуть, що механічний англ. студенти та наші власні студенти з математики будуть відвідувати курс. Інші з економіки electric engg. та студенти з інформатики можуть також відвідувати.
Ашок

Відповіді:


22

Це, здається, вже не є питанням думки: світ, схоже, вийшов за рамки традиційного "викладати ймовірність, а потім викладати статистику як її застосування". Щоб зрозуміти, куди йде викладання статистики, подивіться список заголовків паперу у торішньому спеціальному виданні «Американський статистик» (відтворений нижче): жоден із них не стосується ймовірності.

Вони обговорюють викладання ймовірності та її роль у навчальній програмі. Хороший приклад - праця Джорджа Кобба та його відповіді . Ось кілька відповідних цитат:

Сучасна статистична практика набагато ширша, ніж визнається нашим традиційним навчальним акцентом на висновку на основі ймовірності.

Те, чого ми навчаємо, відстає десятиліттями від того, що ми практикуємо. Наша навчальна парадигма підкреслює формальне висновок із частолістської орієнтації, заснованої або на центральній граничній теоремі на початковому рівні, або в ході математичних спеціальностей на невеликому наборі параметричних імовірнісних моделей, що піддаються рішенням закритої форми, отриманим за допомогою обчислення . Розрив між нашою півстолітньою навчальною програмою та сучасною статистичною практикою продовжує зростати.

Моя теза ... полягає в тому, що як професія ми лише почали вивчати можливості. Історія нашої тематики також підтримує цю тезу: на відміну від ймовірності, частина математики, статистика проросла de novo з ґрунту науки.

Ймовірність - це горезвісно слизька концепція. Розрив між інтуїцією та формальним поводженням може бути ширшим, ніж у будь-якій іншій галузі прикладної математики. Якщо ми наполягаємо на тому, що статистичне мислення обов'язково повинно базуватися на моделі ймовірності, то як ми можемо узгодити цю вимогу з цілями зробити центральні ідеї "простими та доступними" та мінімізувати "передумови дослідження"?

Як мислительний експеримент, пройдіться основними поняттями та теорією оцінки. Зверніть увагу, як майже всі їх можна пояснити та проілюструвати, використовуючи лише обчислення в першому семестрі, з вірогідністю, введеною на цьому шляху.

Звичайно, ми хочемо, щоб студенти вивчали обчислення та ймовірність, але було б добре, якби ми могли приєднатися до всіх інших наук у навчанні фундаментальним поняттям нашої теми для студентів першого курсу.

Тут набагато більше подібного. Ви можете прочитати його самостійно; матеріал є у вільному доступі.

Список літератури

Спеціальний випуск американського статистика на тему "Статистика та навчальний план для студентів" (листопад 2015 р.) Доступний на веб-сайті http://amstat.tandfonline.com/toc/utas20/69/4 .

Навчання студентів наступного покоління "думати з даними": Спеціальний випуск зі статистики та навчальної програми для студентів Дж. Гортона та Йогани С. Хардін DOI: 10.1080 / 00031305.2015.1094283

Лише оновлення - це занадто мало пізно: нам потрібно переосмислити наш навчальний план для студентів на базі Джорджа Кобба DOI: 10.1080 / 00031305.2015.1093029

Статистика викладання на сторінках Google Ніколас Чаманді, Омкар Муралідхаран та Стефан Вагер 283-291 DOI: 10.1080 / 00031305.2015.1089790

Дослідження в галузі статистичних досліджень: підхід до викриття студентів до автентичного аналізу даних Дебора Нолан та Дунканського храму Ланг DOI: 10.1080 / 00031305.2015.1073624

Поза межами звичайного: підготовка магістрантів до робочої групи в галузі статистичного консультування Байран Дж. Смукер та А. Джон Бейлер DOI: 10.1080 / 00031305.2015.1077731

Рамка для втілення справжнього досвіду даних на курсах статистики Скотт Д. Грімшо DOI: 10.1080 / 00031305.2015.1081106

Сприяння концептуальному взаєморозумінню в математичній статистиці Дженніфер Л. Грін та Ерін Е. Бланкетна DOI: 10.1080 / 00031305.2015.1069759

Другий курс зі статистики: Розробка та аналіз експериментів? Наталі Дж. Блейдс, Г. Брюс Шааль та Вільям Ф. Крістенсен DOI: 10.1080 / 00031305.2015.1086437

Курс з вивчення даних для студентів вищих навчальних закладів: Мислення з даними Бен Баумер DOI: 10.1080 / 00031305.2015.1081105

Наука даних у навчальних програмах статистики: підготовка учнів до «думки з даними» Дж. Хардіна, Р. Херла, Ніколаса Дж. Хортона, Д. Нолана, Б. Баумера, О. Холл-Хольта, П. Меррелла, Р. Пенга, П. . Roback, D. Temple Lang & MD Ward DOI: 10.1080 / 00031305.2015.1077729

Використання онлайн-ігор-симуляцій для посилення розуміння учнями практичних статистичних питань у аналізі даних у реальному світі Шонда Куйпер та Родні X. Стурдівант DOI: 10.1080 / 00031305.2015.1075421

Боротьба з антистатистичним мисленням з використанням методів, що ґрунтуються на моделюванні у навчальній програмі студентів Натан Тінтл, Бет Шанс, Джордж Кобб, Сома Рой, Тодд Свонсон та Джилл ВандерСтоп DOI: 10.1080 / 00031305.2015.1081619

Що викладачі повинні знати про завантажувальну програму: перекомпонування навчальної програми статистики студентів, Тім Хестерберг DOI: 10.1080 / 00031305.2015.1089789

Включення статистичних консалтингових досліджень у вступні курси часових рядів Давіт Хачатрян DOI: 10.1080 / 00031305.2015.1026611

Розробка нової міждисциплінарної бакалаврської програми з обчислювальної аналітики: якісний-кількісно-якісний підхід Шотландія Леман, Leanna House та Andrew Hoegh DOI: 10.1080 / 00031305.2015.1090337

Від настанов навчальних програм до результатів навчання: оцінка на рівні програми Beth Chance & Roxy Peck DOI: 10.1080 / 00031305.2015.1077730

Оцінка програми для студентської статистики Майор Елісон Аманда Мур та Дженніфер Дж. Каплан DOI: 10.1080 / 00031305.2015.1087331


3
(+1) Я думаю, що це чудова відповідь. Проблема викладання теорії ймовірностей спочатку полягає в тому, що вона створює враження, що статистика стосується конкретизації, пристосування та діагностики ймовірнісних моделей. Це не лише невелика частина статистики, але вона пропускає деякі найосновніші проблеми, коли думає про дані: як їх візуалізувати та як узагальнити. Які відносні достоїнства середнього чи середнього значення для визначення місця набору даних? Як ми повинні перекреслити наші результати? Які графіки підходять, і що вони нам повідомляють про дані?
Срібна рибка

@Silverfish, це так відрізняється від того, як хлопці, як Бернуллі, підходили до статистики. Погляньте на цей прекрасний документ його спроби нового аналізу смертності від віспи та переваг щеплення для її попередження . В основному він розпочав з цього сучасну епідеміологію. Якби він був орієнтований на речі, про які ви згадували, як візуалізація тощо, він би не зрозумів розуміння основного процесу.
Аксакал

@Aksakal Я не кажу, що моделювання неважливо, і що хороша доза теорії ймовірностей не є життєво важливою. Але статистика ширша за цю. Я думаю, що помилково розглядати теорію ймовірностей як основоположну: або в тій мірі, в якій вона є, це означає, що її потрібно вчити спочатку. В середній школі можна вперше побачити ірраціональний номер, як або , але вони не представляють їх через скорочення Dedekind! Розуміння даних - це щось, що значною мірою доступне для студентів, не маючи пріоритету математики, а пошук моделей важливіший, ніж суп p-значення. 2π
Срібна рибка

Для ранніх проривів в області епідеміології, я підніму вам дослідження Джона Сноу про спалах холери тисяча вісімсот п'ятьдесят-чотири Broad Street - що - то в багатьох хороших книгах впровадження візуалізації даних, а також розумові процеси , на які повинні , безумовно , належать в центрі Статистика 101.
серебрянки

1
@Aksakal Я ціную вашу згадку про Бернуллі. Однак, як піонери та великі математики підходять і вирішують проблеми - це зовсім інша річ, ніж те, як слід викладати рішення. Я бажаю, щоб підкреслити , що ніхто (AFAIK) виступає НЕ навчаючи ймовірність: занепокоєння питання , коли такі ідеї повинні бути введені в вступному (коледж) навчальний план і в якій мірі вони повинні бути продовжені. Існують вагомі педагогічні причини (ґрунтовані як на психології, так і на викладацькому досвіді) для впровадження багатьох статистичних ідей спочатку.
whuber

7

Множина анекдоту не є даними, але майже в будь-якому курсі, який я бачив, принаймні основи ймовірності стають перед статистикою.

З іншого боку, історично склалися звичайні найменші квадрати до того, як було відкрито нормальне розподіл! Статистичний метод вийшов на перше місце, більш суворе, обґрунтоване імовірністю обґрунтування того, чому він працює, вийшло друге!

Історія статистики Стівена Стіглера : Вимірювання невизначеності до 1900 року переносить читача через історичний розвиток:

  • Математики, астрономи розуміли основну механіку і закон гравітації. Вони могли описати рух небесних світил як функцію від кількох параметрів.
  • Вони також мали сотні спостережень небесних тіл, але як слід сполучати спостереження, щоб відновити параметри?
    • Сто спостережень дає вам сто рівнянь, але якщо вирішити лише три невідомі, це завищена система ...
  • Легендр першим розробив метод мінімізації суми помилки квадрата. Пізніше це було пов’язано з роботою з імовірністю Гаусса та Лапласа, що звичайні найменші квадрати були в деякому сенсі оптимальними з огляду на нормально розподілені помилки.

Чому я це виховую?

Існує певна логічна елегантність спочатку створити математичну техніку, необхідну для отримання, розуміння певного методу, для створення фундаменту, перш ніж будувати будинок.

В реальності науки, однак, будинок часто стає першим, фундамент другим: P.

Я хотів би побачити результати навчальної літератури. Що є більш ефективним для викладання? Що тоді чому? Або чому тоді що?

(Я можу бути дивним, але я знайшов історію про те, як найменше квадратів було розроблено, щоб бути захоплюючим перегортанням сторінки! Історії можуть зробити інакше нудними, абстрактні речі оживати ...)


2
Література з питань статистичної освіти видається послідовною та однозначною щодо цього питання: ймовірність не є статистикою, статистика набагато більше, ніж ймовірність, і статистику (принаймні на рівні К-12 та коледжу) слід вводити як мислення з даними, а не як застосування ймовірності. Окрім посилань, які я надав у своїй відповіді, ознайомтеся з іншими вільно доступними ресурсами, такими як CauseWeb , GAISE та J. Statistics Education .
whuber

4

Я думаю, що це має бути ітераційним процесом для більшості людей: ви дізнаєтесь трохи ймовірності, потім трохи статистики, потім трохи більшої ймовірності та трохи більше статистики тощо.

Наприклад, погляньте на вимоги до PhD Stat в GWU. Курс імовірності 8257 рівня доктора наук містить такий короткий опис:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

Зауважте, як у курсах статистики рівня 6201 та 6202 магістра є попередніми умовами. Якщо ви перейдете до статі найнижчого рівня або курсу ймовірності в GWU, ви перейдете до «Вступ до ділової та економічної статистики 1051» або «Вступ до статистики з соціальних наук» 1053 . Ось опис одного з них:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

Зверніть увагу, як у курсі є назва "Статистика", але це вчить ймовірності в ньому. Для багатьох це перша зустріч із теорією ймовірності після курсу середньої школи "Статистика".

Це дещо схоже на те, як його викладали в мої часи: курси та підручники зазвичай мали назву "Теорія ймовірностей та математична статистика", наприклад, текст Гмурмана .

Я не уявляю собі вивчення теорії ймовірностей без будь-якої статистики. Курс докторантури вище 8257 передбачає, що ви вже знаєте статистику. Тож навіть якщо ви спочатку вчите ймовірність, буде задіяно деяке вивчення статистики. Це лише для першого курсу, мабуть, є сенс зважити більше на статистику і використовувати його для введення теорії ймовірностей.

Зрештою, це ітераційний процес, як я описав на початку. І як і в будь-якому хорошому ітераційному процесі, перший крок не важливий, чи буде сама перша концепція зі статистики чи ймовірність не матиме значення після декількох ітерацій: ви потрапите в те саме місце незалежно.

Підсумкове зауваження, підхід до викладання залежить від вашої галузі. Якщо ви вивчаєте фізику, ви отримаєте такі речі, як статистична механіка, статистика Фермі-Дірака, якими ви не збираєтесь займатися в соціальних науках. Крім того, у фізиці частістські підходи є природними, і насправді вони лежать в основі деяких фундаментальних теорій. Отже, має сенс мати окрему теорію ймовірностей, яку викладають на початку, на відміну від соціальних наук, де вона може не мати особливого сенсу витрачати на неї час, а натомість більше важити на статистиці.


2
Зрозуміло, навчальна програма доктора наук, мабуть, не дає вказівки щодо викладання предмету для студентів. Цілі та аудиторія абсолютно різні. Я додам особисту примітку: у своїх взаємодіях з деякими створеними відділами статистики я побачив, що навчальна програма відображає 30-річні ідеї педагогіки та прогресу і продовжуватиму це робити, поки не почнеться покоління викладачів. Можливо , ми повинні бути скупими використання таких програм , як нормативні моделі , що має бути зроблено.
whuber

1
@whuber І тоді навчальний план буде відображати ідеї, що стосуються 30 років ... але, принаймні, вони не будуть ідеями для 60 років. Як би там не було, як сказано, прогрес науки, похорон похоронами.
Марк Л. Стоун
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.