Чи варто спочатку навчати байєсівській чи частолістській статистиці?


32

Я допомагаю своїм хлопцям, які зараз знаходяться в середній школі, розуміючи статистику, і я розглядаю початок з простих прикладів, не ігноруючи деякі погляди до теорії.

Моєю метою було б дати їм найбільш інтуїтивний, але інструментально конструктивний підхід до вивчення статистики з нуля, щоб стимулювати їх інтерес до подальшої статистики та кількісного навчання.

Перш ніж почати, у мене є конкретне питання з дуже загальними наслідками:

Чи варто починати викладати статистику за допомогою байєсівської чи частолістської структури?

Досліджуючи навколо, я бачив, що загальний підхід починається з короткого вступу про частофілістську статистику, а потім глибокого обговорення байєсівської статистики (наприклад, Штангл ).


5
На ваше питання важко відповісти без більшого контексту. Чого б ви хотіли досягти?
Glen_b -Встановіть Моніку

4
Погано виховувати дітей, щоб навчити дітей байєсівській статистиці, схожі на наливання їм горілки чи запалення сигар. Зауважте, що і горілка, і сигари чудово підходять дорослим, якщо вони відкриють їх самостійно
Аксакал

2
@Aksakal Я насправді планував навчити їх теоремі Байєса, попиваючи горілку та роздуваючи гавани ... ;-)
Joe_74

2
Це хороший спосіб утримати дитину подалі від байесівської статистики на кілька років. Ви скажете їм, що це лише додатки теореми Байєса. Теорема чудово працює у статистиці
частотистів

5
Книга Нейт Сілвер «Сигнал і шум» робить приклад для навчання молодих людей байєсівської статистики.
Ллойд Різдво

Відповіді:


25

І баєсівська статистика, і частолістська статистика базуються на теорії ймовірностей, але я б сказав, що перша покладається більше на теорію з самого початку. З іншого боку, напевно поняття достовірного інтервалу є більш інтуїтивним, ніж поняття інтервалу довіри, коли студент добре розуміє поняття ймовірності. Тож, що б ви не вибрали, я закликаю насамперед посилити їх розуміння імовірнісних концепцій із усіма цими прикладами, заснованими на кістяках, картах, рулетках, парадоксі Монті Холл тощо.

Я б вибрав той чи інший підхід, заснований на суто утилітарному підході: чи частіше вони вивчають в школі часто-часто чи баєсівську статистику? У моїй країні вони, безумовно, спочатку засвоїли б частістські рамки (і останнє: ніколи не чули, щоб старшокласники навчали байєсівських статистичних даних, єдиний шанс - або в університеті, або після цього, шляхом самостійного навчання). Можливо, у ваших це інакше. Майте на увазі, що якщо їм потрібно мати справу з NHST (тестуванням значущості гіпотези), це більш природно виникає в контексті періодичної статистики ІМО. Звичайно, ви можете перевірити гіпотези і в байєсівських рамках, але є багато провідних байєсівських статистиків, які виступають за те, щоб взагалі не застосовувати NHST, ні в рамках частістських, ні в байесовських рамках (наприклад, Ендрю Гелман з Колумбійського університету).

Нарешті, я не знаю про рівень старшокласників у вашій країні, але в моїй школі було б дуже важко одночасно засвоювати (основи) теорії ймовірностей та інтегрального числення. Отже, якщо ви вирішите скористатися байєсівською статистикою, я б справді уникав безперервного випадку випадкової змінної і дотримувався дискретних випадкових змінних.


2
У мене було враження (з читання його блогу), що Ендрю Гельман буде виступати проти частолістського НШТ настільки ж, як і проти Байесіана.
псарка

2
@psarka так, звичайно - я ніколи не говорив протилежного.
DeltaIV

3
"У моїй країні вони, безумовно, спочатку засвоїли б частістські рамки" - Це (або опускання дискусії про байесіанство цілком) - традиційний підхід у всьому світі.
Кодіолог

1
@Kodiologist Я підозрював стільки ж. Принаймні, можуть існувати деякі освітні системи, де після частістських рамок також байєсівську систему впроваджують у середній школі. Але це тут не так.
DeltaIV

22

Баєсій і частоліст задають різні питання. Баєсіан запитує, які значення параметрів є достовірними, враховуючи спостережувані дані. Частота запитує про ймовірність уявних модельованих даних, якщо деякі гіпотетичні значення параметрів були правдивими. Рішення частопедагоги мотивуються контролем помилок, байесівські рішення мотивовані невизначеністю в описах моделей.

Отже, чого слід вчити спочатку? Що ж, якщо одне чи інше з цих питань - це те, що ви хочете задати спочатку, це ваша відповідь. Але з точки зору доступності та педагогіки, я вважаю, що Байесіан набагато простіше зрозуміти і набагато інтуїтивніше. Основна ідея байєсівського аналізу - це перерозподіл правдоподібності за можливостями, подібно до того, як чудово сказав Шерлок Холмс, і який мільйони читачів зрозуміли інтуїтивно. Але основна ідея частого аналізу є дуже складною: простір усіх можливих наборів даних, які могли б статися, якби певна гіпотеза була правдивою, і частка тих уявних наборів даних, які мають підсумкову статистику як більш кращу, ніж підсумок статистика, яка насправді спостерігалася.

Вільна вступна глава про ідеї байесовских знаходиться тут . Стаття , яка встановлює і байєсівську частотну концепції поруч знаходиться тут . У статті пояснюються частістські та баєсовські підходи до тестування гіпотез та оцінки (та багато іншого). Рамка статті може бути особливо корисною для початківців, які намагаються зрозуміти краєвид.


У тому числі заголовки глави та статті можуть бути корисними у випадку, якщо посилання в майбутньому перестануть зникати.
Річард Харді

8

Це питання ризикує грунтуватися на думці, тому я спробую бути дуже коротким зі своєю думкою, а потім надам вам пропозицію щодо книги. Іноді варто скористатися певним підходом, оскільки це дуже підходяща книга.

Я погодився б, що баєсовська статистика більш інтуїтивна. Інтервал довіри порівняно з достовірним відмінністю інтервалу в значній мірі підсумовує це: люди, природно, думають з точки зору "який шанс, що ...", а не підходу Інтервал довіри. Підхід «Довірчий інтервал» звучить дуже схоже на те, що він говорить те саме, що і «Вірогідний інтервал», за винятком загального принципу, ви не можете зробити останній крок від «95% часу» до «95% шансу», що здається дуже частою, але ви не можу це зробити. Це не непослідовно, просто не інтуїтивно.

Балансування цього полягає в тому, що більшість курсів коледжів, які вони пройдуть, використовуватимуть менш інтуїтивно зрозумілий частістський підхід.

Це сказало, що мені дуже подобається книга " Статистичне переосмислення": Байєсівський курс із прикладами в "R and Stan " Річарда МакЛарета. Це недешево, тому, будь-ласка, прочитайте про це та поцікавтеся в ньому на Amazon, перш ніж купувати. Я вважаю це особливо інтуїтивним підходом, який використовує перевагу байєсівського підходу, і він дуже практичний. (Оскільки R і Stan є прекрасними інструментами для байєсівської статистики і вони безкоштовні, це практичне навчання.)

EDIT: Кілька коментарів згадують, що книга, мабуть, виходить за межі Високого Школяра, навіть із досвідченим викладачем . Тож мені доведеться розмістити ще більший застереження: він має простий підхід на початку, але швидко наростає. Це дивовижна книга, але вам, справді, справді доведеться зазирнути по Амазонії, щоб відчути свої початкові припущення та те, наскільки швидко вона наростає. Прекрасні аналогії, чудова практична робота в R, неймовірний потік та організація, але, можливо, не корисні для вас.

Він передбачає базові знання програмування та R (безкоштовний статистичний пакет), а також деякий вплив основ імовірності та статистики. Це не випадковий доступ, і кожна глава будується на попередніх главах. Це починається дуже просто, хоча складність все-таки наростає - закінчується багаторівневою регресією. Тож, можливо, ви захочете переглянути його в Amazon і вирішити, чи зможете ви легко висвітлити основи, або якщо він стрибне трохи занадто далеко вниз по дорозі.

EDIT 2: Підсумок мого внеску тут і спроба відвернути його від чистої думки полягає в тому, що хороший підручник може вирішити, який підхід ви приймете. Я вважаю за краще байєсівський підхід, і ця книга робить це добре, але, можливо, в занадто швидкому темпі.


2
Книга McElreath відмінна, але я був би дуже здивований, якби старшокласники змогли пройти цей рівень лікування навіть із талановитим репетитором.
DeltaIV

2
@DeltaIV: Хороший відгук, я відредагую свою відповідь. Мене кілька разів обманювали, наскільки це читабельне та аналогічне на початку. Це вводить круту криву навчання навколо на півдорозі, і, ймовірно, набагато раніше, ніж це.
Уейн

1
Ще одне зауваження: Я думаю, що між фундаментальними принципами (тобто теорією ймовірностей) та застосуванням у частотологічних методах порівняно з байєсівськими методами існує більший розрив. Тобто, я маю труднощі уявити, що хтось справді розуміє теорію MLE, доказ CLT тощо, без освіти випускника, яка потрібна навіть для найпростіших процедур частоти. Коли ви знаєте умовну ймовірність, ви в основному розумієте, як працює байєсівський умовивід. Теорія MCMC трохи хитра, але, чесно кажучи, набагато простіша, ніж справді розуміння теорії MLE ...
Cliff AB

... і оскільки легше подолати розрив між вірогідністю та застосуванням статистики в байєсівських рамках, принаймні, я думаю, що це робить розумовіші задоволення більш швидкими. Я ненавидів TA-ing курси, де нам довелося сказати "і довіряйте нам, теорія MLE працює з великими зразками", оскільки я відчував, що треба дещо вбити чиюсь наукову цікавість або вимагати значно більшої розумової прихильності.
Cliff AB

... Але інтуїція за млеками є достатньо природною ... stats.stackexchange.com/questions/112451/…
kjetil b halvorsen

5

Мене вчили спершу частолістський підхід, потім байєсівський. Я не є професійним статистиком.

Я мушу визнати, що не вважав, що мої попередні знання про частістський підхід були надзвичайно корисними для розуміння байєсівського підходу.

Я б наважився сказати, що це залежить від того, які конкретні програми ви будете показувати своїм учням далі, і скільки часу і сил ви витратите на них.

Сказавши це, я би почав з Байєса.


3

Байєсівські рамки тісно поєднані з загальними навичками критичного мислення. Це те, що вам потрібно в наступних ситуаціях:

  1. Ви думаєте про те, щоб подати заявку на конкурсну роботу. Які у вас шанси потрапити? Яку виплату ви очікуєте від подання заявки?
  2. Заголовок повідомляє, що мобільні телефони довготерміново викликають рак у людини. Скільки доказів вони мають для цього?
  3. На яку благодійну допомогу потрібно пожертвувати гроші, якщо ви хочете, щоб вони мали найбільший ефект?
  4. Хтось пропонує повернути монету зі ставкою 0,90 доларів від вас та 1,10 долара від них. Ви б їм дали гроші? Чому, чому ні?
  5. Ви втратили ключі (або атомну бомбу). З чого ти починаєш шукати?

Крім того, це набагато цікавіше, ніж запам’ятовування формули для двох тестових тестів: p. Що збільшує ймовірність того, що студенти залишаться зацікавленими досить довго, щоб потурбуватися про все більш технічний матеріал.


3

Ніхто не згадав про ймовірність, що є основою байєсівської статистики. Аргумент на користь навчання Байєса спочатку полягає в тому, що потік від ймовірності, до ймовірності, до Байєса, є досить безпроблемним. Байєса можна мотивувати з імовірністю, зазначивши, що (i) функція ймовірності виглядає (і діє) як функція розподілу ймовірностей, але це не тому, що площа під кривою не 1,0, а (ii) сирий, широко використовуваний Уолд інтервали передбачають функцію вірогідності, пропорційну нормальному розподілу, але байєсівські методи легко долають це обмеження.

Інший аргумент, що сподобається спочатку Байєсу, полягає в тому, що занепокоєння P (A | B) проти P (B | A) щодо p-значень може бути легше пояснити, як зазначають інші.

Ще один аргумент на користь "Байєса спочатку" полягає в тому, що він змушує студентів більш ретельно продумати моделі умовної ймовірності, що корисно в інших місцях, наприклад, в регресійному аналізі.

Вибачте за саморекламу, але оскільки це повністю на тему, я не проти зазначити, що це саме той підхід, який ми і Кевен Хеннінг застосували у нашій книзі "Розуміння передових статистичних методів" ( https: // peterwestfall. wixsite.com/book-1 ), цільова аудиторія якої є нестатистами.


2

Ви навчаєте для розваги та проникливості чи для практичного використання? Якщо мова йде про навчання та розуміння, я б пішов Байєсом. Якби у практичних цілях, я б неодмінно пішов до лікаря-лікаря.

У багатьох галузях - і я вважаю, що в більшості галузей - природничих наук, люди використовуються для публікації своїх праць із значенням p. Вашим "хлопцям" доведеться читати документи інших людей, перш ніж вони прийдуть писати свої. Щоб читати документи інших людей, принаймні в моєму полі, вони повинні розуміти нульові гіпотези p-значень, якими б дурними вони не з'являлися після байєсівських досліджень. І навіть коли вони будуть готові опублікувати свою першу роботу, у них, ймовірно, буде якийсь старший вчений, який керує командою, і, швидше за все, вони віддають перевагу частотинізму.

Враховуючи це, я хотів би погодитися з @Wayne, що статистичне переосмислення показує дуже чіткий шлях до байєсівської статистики як першого підходу, а не на основі наявних знань про частотизм. Чудово, як ця книга не намагається переконати вас у боротьбі за кращу чи гіршу статистику. Викладений аргумент автора для Байєса (IIRC), що він викладає обидва види, і Байєсу було легше навчати.


2

Я б тримався подалі від Баєсіана, слідкував за гігантами.

Совєти мали чудову книжкову серію для учнів середньої школи, грубо перекладену англійською мовою як "маленьку бібліотеку". Колмогоров написав книгу з співавторами під назвою "Вступ до теорії ймовірностей". Я не впевнений, що він коли-небудь був перекладений англійською мовою, але ось посилання на його російський оригінал.

Вони підходять до пояснення ймовірностей за допомогою комбінаторики, що, на мою думку, є прекрасним способом почати. Книга дуже доступна для старшокласника з гідною математикою. Зауважте, що радянські навчання викладали математику досить широко, тому середні західні старшокласники можуть бути не так добре підготовлені, але, на мій погляд, достатньо інтересу та сили волі все-таки можуть обробляти вміст.

Зміст дуже цікавий для студентів, він має випадкові прогулянки, обмеження розповсюдження, процеси виживання, закон великої кількості тощо. Якщо поєднувати такий підхід з комп'ютерними моделюваннями, це стає ще веселішим.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.