Чому баєсівська статистика стає все більш популярною темою дослідження? [зачинено]


10

Переглядаючи область досліджень 100 найпопулярніших програм статистики новин США, майже всі вони важкі в баєсівській статистиці. Однак, якщо я переходжу до школи нижчого рівня, більшість із них все ще займаються класичною / частою статистикою. Наприклад, у моїй теперішній школі (яка класифікується від 150 до 200 у світовому рейтингу QS за статистикою, тому не вважається школою вищого рівня) є лише один професор, який зосередився на байєсівській статистиці, і є майже обурення щодо байєсівської статистики. Деякі студенти, з якими я розмовляв, навіть кажуть, що байєські статистики роблять баєсівські статистики заради цього, я, звичайно, сильно не згоден.

Однак мені цікаво, чому це так. У мене є кілька освічених здогадок:

(a) не залишається достатньо місця для просування в галузі методології класичної / частої статистики, і єдине життєздатне дослідження класичного / частого періодичного дослідження - це програми, які будуть основним напрямком нижчого рівня школи, оскільки школа вищого рівня повинна бути більше схильний до теоретико-методологічних досліджень.

(b) Це сильно залежить від поля. Певна галузь статистики просто більше підходить для байесівської статистики, наприклад, багато наукових застосувань методу статистики, тоді як інша галузь більше підходить для класичної статистики, наприклад фінансової сфери. (виправте мене, якщо я помиляюся) З огляду на це, мені здається, що вищі школи вищих навчальних закладів мають багато статистичних факультетів, які роблять заявки в науковій галузі, тоді як відділ статистики шкіл нижчого рівня в основному фокусує додатки у фінансовій сфері, оскільки це допомагає їм отримувати дохід та фінансування.

(c) Існують величезні проблеми з методом частолістів, який неможливо вирішити, наприклад, схильний до перевищення MLE тощо. І, здається, Bayesian пропонує геніальне рішення.

(d) Обчислювальна потужність тут, отже, байесівські обчислення вже не вузьке місце, як це було 30 років тому.

(д) Цей, можливо, є найпотаємнішим здогад, який у мене є. Існує опір класичного / частотистського статистиків, що просто не подобається нова хвиля методології, яка потенційно може обігнати роль класичної статистики. Але, як сказав Ларрі Вассерман, це залежить від того, що ми намагаємось зробити, і кожен повинен залишатися відкритим, особливо як дослідник.


1
У той час як думки авторитетів резюме будуть різними, і така думка вважається поза темою, варто зазначити, що саме на це питання відповідають у вступних розділах сучасних текстів про байєсівський аналіз. Зокрема, глава 1 Gelman, et al. Bayesian Data Analysis 3rd Ed. Це зводиться до а) "здорового глузду" та б) надзвичайно проблемного інтервалу довіри частого характеру, який 99% з нас не можуть не допомогти, але неправильно трактувати. Те, як ми його неправильно інтерпретуємо, є власне байєсівським, тому ми можемо також зробити байєсівський аналіз з початку роботи.
Петро Леопольд

3
@ Петер Леопольд Наполовину серйозно: 99%? а хто "ми"? Багато наївних користувачів статистики справді мають серйозні помилки щодо ІП, але якщо ви звертаєтесь до спільноти CV, я би сподівався, що 99% дійсно не підходить. Люди статистики можуть бути так само погано, як і будь-хто інший, коли складають цифри за відсутності важких даних!
Нік Кокс

@NickCox Я звертався до ОП, і "ми" мають на меті співпереживати та включати. Сподіваємось, що "99%" визнано порядком оцінки величини10-2. Це також більша частка популярної культури " мати / не мати" , де в цьому контексті невідомі вказують на подію: "Я взяв статистику 101, але я не повністю усвідомив інтерпретацію частотистських проти байесівських інтервалів довірчих інтервалів. порівняно з достовірними інтервалами. " А тепер, коли ви мене зателефонували, я запевняю (: D), що це моя посадова особа до цієї події! Природно, я готовий переконатись інакше! : D
Петро Леопольд

Відповіді:


8

Особисто я б зважився на кілька здогадок:

(1) Байєсська статистика побачила величезну популярність в останні пару десятиліть. Частина цього була пов'язана з просуванням в MCMC та вдосконаленням обчислювальних ресурсів. Байєсівська статистика пішла від теоретично дійсно приємного, але застосовного лише до проблем із іграшками, до підходу, який може бути застосований більш універсально. Це означає, що кілька років тому, кажучи, що ви працювали над статистикою Байєса, ймовірно, ви зробили дуже конкурентоспроможним.

Зараз я б сказав, що баєсівська статистика все ще є плюсом, але так працює над цікавими проблемами без використання байєсівських методів. Відсутність фону в статистиці байєсівської б , звичайно, мінус для більшості наймають комітетів, але отримати докторську ступінь в області статистики без достатньої підготовки в методах байєсівської було б досить дивно.

(2) Баєсійські статистики згадають "Баєсійський" у своєму резюме. Зазвичай користувачі не ставлять на резюме «Частоту», але набагато частіше область, в якій вони працюють (тобто аналіз виживання, прогнозне моделювання, прогнозування тощо). Як приклад, багато моєї роботи - це написання алгоритмів оптимізації, що, напевно, означає, що ви б сказали, означає, що я займаюся частою роботою. Я також написав неабиякий фрагмент алгоритмів Байєса, але це, безумовно, меншість моєї роботи. Байєсівська статистика є в моєму резюме, статистика - часто.

(3) В тій мірі, що ви сказали у своєму запитанні, також є правдою. Ефективне загальне байєсівське обчислення має в ньому більш відкриті проблеми, ніж сфера частота. Наприклад, останнім часом Гамільтоніанський Монте-Карло став дуже захоплюючим алгоритмом для загального вибору з байєсівських моделей. Немало місця для поліпшення загальногооптимізація в ці дні; Алгоритми Ньютона Рафсона, L-BFGS та EM охоплюють багато основ. Якщо ви хочете вдосконалити ці методи, вам, як правило, потрібно багато спеціалізуватися на проблемі. Таким чином, вам більше подобається говорити "Я працюю над оптимізацією геомістких просторів", а не "Я працюю над високовимірною оцінкою максимальної ймовірності". Світ машинного навчання є дещо винятком з цього, оскільки є багато хвилювань у пошуку нових методів стохастичної оптимізації (наприклад, SGD, Адама тощо), але це трохи інший звір з кількох причин.

Аналогічно, там потрібно виконати роботу над створенням хороших пріорів для моделей. Методи частотні зробити є еквівалент цього (придумує хороші штрафи, тобто, ласо, glmnet) , але, ймовірно , більш благодатний грунт для настоятелів над штрафами.

(4) Нарешті, і це, безумовно, більше особиста думка, багато людей пов'язують частотерапевта з р-значеннями. Зважаючи на загальне неправомірне використання p-значень, яке спостерігається в інших сферах, багато статистиків хотіли б дистанціюватися якнайдалі від поточних зловживань р-значень.


3
Отже, відповідь на те, чому він стає більш популярним, включає (1) він стає більш популярним. Озадачено це, але я думаю, що це лише питання необхідності переформулювати слово.
Нік Кокс

@NickCox: моя точка в тому , що вона є більш популярною, а й його популярність може бути дещо завищена. Тобто, ОП побачило, що статистика Баєса є резюме майже кожного професора на вибірці університетів вищого рівня. Але це не означає, що кожен з цих викладачів займається лише баєсівською статистикою. Ще один пункт (1) полягав у тому, що я думаю, що був час, коли проводилася байєсівська статистика, оскільки ваша дослідницька область була дуже важливою для отримання позиції вищого рівня. Я не впевнений, що це вимоги вже суворі, але багато професорів, яких ви бачите зараз, були найняті за цей час.
Кліф АВ

О, я бачу вашу думку. Я зосереджувався на обговоренні "Це тому, що не вистачає місця для просування в класичній / частістській статистиці?" і не стільки на тему "чому це відбувається?"
Кліф АВ
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.