Чому байєсова статистика не є більш популярною для контролю статистичних процесів?


18

Я розумію, що баєсийські та частосоціальні дебати - така статистика часто:

  • є (або претендує на це) об'єктивним
  • або принаймні неупереджено
  • тому різні дослідники, використовуючи різні припущення, все ще можуть отримати кількісно порівнянні результати

в той час як байєсівська статистика

  • вимагає робити "кращі" прогнози (тобто менші очікувані втрати), оскільки може використовувати попередні знання (серед інших причин)
  • потребує меншої кількості "спеціальних" варіантів, замінюючи їх попередніми / модельними варіантами, які (принаймні в принципі) мають реальну інтерпретацію.

Враховуючи це, я б очікував, що байесівська статистика буде дуже популярною в SPC: Якби я був власником фабрики, який намагався контролювати якість свого процесу, я б в першу чергу дбав про очікувані втрати; Якби я міг зменшити це, бо я маю більше / краще попередні знання, ніж мої конкуренти, навіть краще.

Але практично все, що я читав про SPC, здається, є досить частою (тобто відсутність попередніх розподілів, точкова оцінка всіх параметрів, багато спеціальних виборів щодо розміру вибірки, p-значень тощо)

Чому так? Я можу зрозуміти, чому частоталістична статистика була кращим вибором у 60-х роках минулого століття, коли SPC робився за допомогою ручки та паперу. Але чому з тих пір ніхто не пробував різних методів?


2
Я думаю, що Bayesian статистика є моєю цифровою SLP-камерою, а частою, як iPhone-камерою. Я купив їх колись, але я використовую DSLR менше 5% фотографій, тоді як телефон відпочиває 95%. Тому що це легко, зручно і в кишені, і багато часу надає відповідно до якості (на основі моїх навичок DSLR). Так само, як вбудовувати пріори та ланцюги в сіно, мені потрібно знайти оптимальний баланс тривалості відкриття отвору, довжини та інших параметрів. Iphone кінець популярний.
Рам Шарма

@RamSharma слід опублікувати це як відповідь! Мені це подобається краще, ніж моя аналогія кухарського ножа.
shadowtalker

Відповіді:


18

ПОПЕРЕДЖЕННЯ Я відповів на цю відповідь дуже давно, з дуже малою ідеєю, про що я говорив. Я не можу видалити його, оскільки це було прийнято, але я не можу стояти за більшою частиною вмісту.


Це дуже довга відповідь, і я сподіваюся, що це допоможе певним чином. SPC - це не моя область, але я вважаю, що ці коментарі є загальними для їх застосування тут.

Я заперечую, що найбільш часто цитується перевага - можливість включення попередніх переконань - є слабкою перевагою застосованих / емпіричних полів. Це тому, що вам потрібно кількісно оцінити попереднє. Навіть якщо я можу сказати "ну, рівень z, безумовно, неправдоподібний", я не можу за все життя сказати вам, що повинно статися нижче z. Якщо автори не почнуть публікувати свої неодноразові дані групою, мої найкращі здогадки для пріорів - це умовні моменти, взяті з попередньої роботи, які можуть бути, а можуть і не бути пристосовані в подібних умовах, ніж ті, з якими ви стикаєтесь.

В основному, байєсівські методи (принаймні на концептуальному рівні) відмінно підходять, коли у вас є чітке припущення / ідея / модель і хочете взяти їх до даних, то подивіться, наскільки ви неправильно чи не так ви виявитеся. Але часто ви не дивитесь, чи маєте ви право на одну конкретну модель для вашого бізнес-процесу; швидше у вас немаємодель, і шукаєте, щоб побачити, що ваш процес буде робити. Ви не хочете підштовхувати свої висновки, ви хочете, щоб ваші дані підштовхували свої висновки. Якщо у вас є достатня кількість даних, це все одно відбудеться, але в такому випадку навіщо турбуватися з попереднім? Можливо, це надто скептично та ризикує, але я ніколи не чув про оптимістичного бізнесмена, який також був успішним. Там немає ніякого способу , щоб кількісно оцінити вашу невпевненість у власних переконаннях, і ви воліли б не ризикуєте бути самовпевненим в неправильні речі. Таким чином, ви встановлюєте неінформативний поперед, і перевага зникає.

Це цікаво у випадку з SPC, оскільки на відміну від, скажімо, цифрового маркетингу, ваші бізнес-процеси не назавжди перебувають у непередбачуваному потоці. Моє враження, що бізнес-процеси, як правило, змінюються свідомо та поступово. Тобто у вас є тривалий час, щоб будувати добрі, безпечні пріорі. Але пам’ятайте, що пріори стосуються пропаганди невизначеності. Окрім суб’єктивності, байєсіанство має перевагу в тому, що об’єктивно поширює невизначеність у глибоко вкладених процесах генерування даних. Це, на мій погляд, дійсно те, для чого баєсівська статистика хороша. І якщо ви шукаєте надійність свого процесу далеко за межі "значущості" 1-в-20, вам здається, ви хотіли б врахувати якомога більше невизначеності.

То де ж басейські моделі? По-перше, їх важко реалізувати. Якщо говорити прямо, я можу навчити OLS інженеру-механіку за 15 хвилин, і він ще раз виправить регресії та t-тести в Matlab. Для того, щоб використовувати Bayes, я спершу повинен вирішити, яку модель мені підходить, а потім подивіться, чи є готова бібліотека для неї мовою, яку хтось із моєї компанії знає. Якщо ні, я повинен використовувати BUGS або Stan. І тоді мені доведеться запустити моделювання, щоб отримати навіть основну відповідь, а на 8-ядерній машині i7 потрібно 15 хвилин. Стільки для швидкого прототипування. І по-друге, до моменту отримання відповіді ви витратили дві години кодування та очікування, тільки щоб отримати той самий результат, який можна було мати при частолістських випадкових ефектах із кластеризованими стандартними помилками. Можливо, це все нахабно і недоброзичливо, і я взагалі не розумію SPC.

Я уподібнюю байєсіанство з дуже якісним кухарським ножем, запасом та сковородою ; частоталізм - це кухня, наповнена інструментами As-Seen-On-TV, як бананові шматочки та горщики для макаронних виробів з отворами у кришці для легкого зливу . Якщо ви кухар-практик з великим досвідом роботи на кухні - справді, на власній кухні предметних знань, яка є чистою та організованою, і ви знаєте, де все знаходиться - ви можете робити дивовижні речі з вашим невеликим вибором елегантні, якісні інструменти. Або ви можете використовувати купу різних маленьких спеціальних інструментів *, для використання яких потрібна нульова майстерність, щоб зробити страву простою, справді не наполовину поганою, і має пару основних смаків, які мають точку зору. Ви щойно повернулися додому з даних шахт і ви голодні за результатами; який кухар ти?

* Байєс настільки ж специфічний, але менш прозорий . Скільки вина йде у вашому coq au vin? Поняття не маєш, очне яблуко це, бо ти професіонал. Або ви не можете сказати різницю між Піно Гриджо та Піно Нуар, але перший рецепт Епікурі говорив про використання 2 склянок червоного, так що ви збираєтеся робити. Який з них є більш "тимчасовим?"


1
+1, чудова відповідь. Мені цікаво: чи можете ви додати абзац про малі / адаптивні розміри вибірки? У SPC зразки розміром 3-5 є звичайними. І якщо програмне забезпечення SPC могло сказати техніку після двох зразків, чи справді йому потрібні ще 3 зразки чи ні, це було б чудовою особливістю. Що стосується байєсівської моделі, це майже нерезультативно: визначте витрати на вимірювання, помилкові позитиви та -негативи, а потім оцініть очікувану вартість проведення іншого вимірювання проти зупинки. У частотистській статистиці вам доведеться мати справу з дивними ефектами припинення правил (Чи можете ви навчити їх МО за 15 хв?)
nikie

1
Що стосується розміру вибірки, то проблема, і я б це зазначив, якби я знав, що зразки були такими невеликими, це те, що при дуже малих спостереженнях ваші оцінки будуть дуже чутливі до вашого вибору попереднього. Ви не можете взяти кров з каменю, тож це є компромісом: або ви сильно переповнюєте частістський оцінювач, але робите це з невеликими припущеннями, або ви включаєте свої власні знання (або їх відсутність) у досить розпливчасті раніше і по суті підходять як до даних, які ви маєте перед собою, так і до "даних", які у вас є в голові. Вам дозволяється мати уніформу в голові.
тіньтакер

1
В основному, Бейс покладає більше тягаря на аналітика, щоб спочатку використовувати її мозок. Я особисто думаю, що протидіяти ідеї встановлення пріорів - це ознака того, що ви або а) занадто ліниві, або б) насправді не розумієте, як працює статистика (потрібно знати її тощо). Я сказав, що важко оцінити пріорів у своїй відповіді; Я фактично не згоден з цим на практиці. Одне, що ви завжди можете зробити, це намалювати криву дзвінка на сторінці, і запитати себе: "я б очікував, що мої дані виглядатимуть так?" Якщо ні, почніть налаштування кривої. І якщо ви не можете вирішити, де дотримуватися режиму, використовуйте гіперприор.
тіньтакер

2
Одне питання (не призначений для дурного): ви знаєте, що є література про (кількісно) виклик попередніх переконань, правда? У тому числі опубліковані переконання, опитані експертні та неекспертні переконання та власні переконання. Причина, про яку я запитую, полягає в тому, що я чув цю скаргу раніше, але автори таких скарг вважали, що їх заперечення - це кінець дискусії, а не початок розслідування.
Олексій

1
@CliffAB Цікаво ... Я не читав цієї літератури глибоко (Бернардо, Каас, Гартвайт ... з декількох десятиліть тому назад) ... але це для вас наука, орієнтована на цінність: різні попередні переконання інформують, чи віддавати перевагу частолістським чи байєсовим методам. ;)
Олексій

5

На мою скромну думку, статистика Байєса страждає від деяких недоліків, що суперечать її широкому використанню (як в SPC, так і в інших наукових секторах):

  1. Складніше отримати оцінки порівняно з його партнером-частістами (найширша частина класів зі статистики застосовує частістський підхід. До речі, було б цікаво дослідити, чи це є причиною чи наслідком обмеженої популярності байєсівської статистики ).

  2. Дуже часто байєсівська статистика нав'язує вибір щодо різних способів вирішення однієї і тієї ж проблеми (наприклад, який найкращий варіант?), А не просто натискання і побачення (все одно, такий підхід не слід заохочувати і в рамках частотистських рам).

  3. Байєська статистика має деякі теми, якими важко керувати менш досвідчені статистики (наприклад, неналежні пріорі );

  4. Він вимагає аналізу чутливості (як правило, його уникають у рамках частістських рамок) та винятків для деяких тем, таких як аналіз відсутніх даних.

  5. У ньому є лише одне (похвально, безкоштовне для завантаження) програмне забезпечення, доступне для розрахунку.

  6. Потрібно більше часу, щоб бути автономним дослідником з байесівськими, ніж з інструментами частолістізму.


6
Хороша відповідь, але я не згоден з пунктом 5: Я можу придумати багато різних (безкоштовних) програмних засобів для аналізу Bayes: WinBUGS, OpenBUGS, JAGS, Stan, PyMC ... і я впевнений, що їх є більше. Що б я сказав, це те, що все це програмне забезпечення має круту криву навчання і вимагає пристойного обсягу знань з програмування та статистики.
COOLSerdash

COOLSerdash має рацію, і я вітаю як роз'яснення, так і коментарі. Моя відсутність вичерпності в переліку програмного забезпечення для байєсівського аналізу, ймовірно, була обумовлена ​​моїм (вільним) знайомством лише з WinBugs.
Карло Лаццаро

@CarloLazzaro Я погоджуюсь з пунктом COOLSerdash щодо №5. Також: Версія 14, приватний ліцензований ще основний пакет статистичних даних Stata тепер включає байєсівські моделі та оцінки в ванільний пакет. Я думаю, що байесівська доступність для обчислень лише зростатиме. Але ваші інші моменти важливі і повинні допомогти інформувати порядок денний для прихильників Байєса.
Олексій

@Alexis: будучи користувачем Stata, я задоволений доволі недавнім байєсівським смаком. Як більш загальну думку, я б попросив вивчити як частістські, так і баєсовські підходи під час статистичних занять в університеті (напевно, ймовірності почнуть бурчати !!).
Карло Лаццаро

3

Однією з причин є те, що байєсівська статистика була заморожена з мейнстріму приблизно до 1990 року. Коли я вивчав статистику в 1970-х, це була майже єресь (не скрізь, але в більшості випускних програм). Це не допомогло, що більшість цікавих проблем були нерозв'язними. Як результат, майже кожен, хто сьогодні викладає статистику (і переглядає статті для журналів та розробляє навчальні програми), готується до участі в роботі. Речі почали змінюватися приблизно з 1990 року з популяризацією методів ланцюга Маркова Монте-Карло (MCMC), які поступово проникають у такі пакети, як SAS та Stata. Особисто я думаю, що вони будуть набагато частішими через 10 років, хоча в спеціалізованих програмах (SPC) вони можуть не мати великої переваги.

Одна з груп, що прокидається, робить аналіз Байєса більш широким доступним - це група, що розробляє пакет STAN (mc-stan.org).


Ласкаво просимо на наш сайт! Лише зауважте, що це "Stata", а не "STATA" - я потрапив у неправильний кінець користувачів Stata, коли сам це використав з великої літери! (Я думав, це як SAS, SPSS тощо, але, мабуть, ні ...)
Silverfish
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.