Хто такі лікарі?


55

У нас вже була тема, яка запитує, хто такі байєси, і хто питає, чи часто є байєси , але жодної теми не запитували, хто такі часто ? Це питання, яке поставив @whuber як коментар до цієї теми , і на нього потрібно просити відповіді. Чи існують вони (є якісь самоідентифіковані лікарі)? Може бути, вони були просто складені байєсами, котрі потребували козла відпущення, коли критикували основну статистику?

Мета-коментар до вже наданих відповідей: На відміну від Баєсової статистики не визначається лише з точки зору використання теореми Байєса (також не байєсівці), а також з використанням суб'єктивістської інтерпретації ймовірності (ти не називав би жодного лайперсона кажучи такі речі, як "я сумніваюся, шанс менше 50:50!", байєсів) - тож чи можна визначити частолізм лише з точки зору прийнятого тлумачення ймовірності? Більше того, статистика застосована ймовірність , тож чи слід визначення частолізму орієнтуватися виключно на інтерпретацію ймовірності?


10
Я б все-таки хотів дізнатися, що таке "частотук"? Я вбачав, що цей термін використовується як очевидне посилання на "будь-якого не-байесівця", а також на когось, хто підписується на частотологічну філософію вірогідності. Я знаю, що є багато перших, але я не впевнений, що є живі прихильники останніх!
whuber

9
Будь ласка, рахуйте мене як частолюбиця. Давайте об’єднаємось! Об'єднані, ми будемо сильні, щоб знищити Баєсіана біля воріт раз на раз!
Аксакал

10
@Aksakal повторюю нескінченну кількість разів, і я вважаю це важливим;)
Тім

5
Обережно, кого ти називаєш Баєсіаном. Пер Д. Д. Ліндлі "Немає менш байєсів, ніж емпіричний баєс". Багато користувачів так званих байєсівських методів насправді не є баєсами. Тепер із швидкими комп’ютерами та MCMC всі раптом є баєсом? Для багатьох людей це просто інший розрахунок, як і будь-який інший, а не глибока філософія. Чи розділене населення нерівномірно, і тільки між частотаністами та баєсами. Як щодо когось без відповідної освіти, що вони? Чи може бути ступінь (або частота) байєсності? Може бути різним в різні дні тижня або типи аналізу?
Марк Л. Стоун

10
Тім, я боюся, на цю нитку може вплинути така ж плутанина, як і деякі споріднені теми: а саме, існують статистичні методи часто-проти-байесів і є ймовірність інтерпретації часто-проти-баєса. Це два різні питання! Про кого ви питаєте? Плутанина очевидна вже зараз, у коментарях до відповіді @ fcop; fcop говорить про визначення / інтерпретацію ймовірності, тоді як ви згадали OLS, а це - про статистичні методи.
Амеба каже, що повернеться до Моніки

Відповіді:


35

Деякі існуючі відповіді говорять про статистичний висновок, а деякі про інтерпретацію ймовірності, і жоден чітко не розрізняє. Основна мета цієї відповіді - зробити це відмінністю.


Слово "частолізм" (і "частіст") може позначати ДВІ РІЗНІ РЕЧІ:

  1. Одне - питання про те, що таке визначення чи тлумачення "ймовірності". Існує чимало тлумачень, одне з яких є "частою інтерпретацією". Найчастіше люди, які дотримуються цього тлумачення, будуть.

  2. Іншим є статистичний висновок про параметри моделі на основі спостережуваних даних. Існують байєсівський і частофілістський підходи до статистичного висновку, і часто лікарі, які вважають за краще використовувати частолістський підхід, - це часто.

Зараз приходить спекуляція: я думаю, що майже немає лікарів першого типу (P-частоти) , але є дуже багато лікарів другого роду (S-часто) .


Часте тлумачення ймовірності

Питання про те, що є ймовірністю, є предметом гострих тривалих дискусій із історією 100+ років. Належить до філософії. Я маю на увазі будь-кого, хто не знайомий з цією дискусією, до статті « Інтерпретації ймовірності» в «Стенфордській енциклопедії філософії», яка містить розділ про періодичні інтерпретації. Ще один дуже читабельний обліковий запис, про який я випадково знаю, - це документ: Appleby, 2004 р., Ймовірність є одноразовою або нічого - що написано в контексті основ квантової механіки, але містить розділи, присвячені тому, що таке ймовірність.

Appleby пише:

Частоталізм - це положення про те, що твердження про ймовірність еквівалентне висловлюванню частоти про якийсь відповідний вибраний ансамбль. Наприклад, згідно з фон Мізеса [21, 22], твердження "ймовірність появи цієї монети на рівні 0,5" еквівалентна твердженню: "у нескінченній послідовності кидок ця монета придумає голови з обмежувальною відносною частотою 0,5" .

Це може здатися розумним, але з таким визначенням існує стільки філософських проблем, що навряд чи можна знати, з чого почати. Яка ймовірність того, що завтра буде дощ? Безглузде питання, бо як у нас буде нескінченна послідовність випробувань. Яка ймовірність того, що монета в моїй кишені піднімається головами? Відносна частота голів у нескінченній послідовності кидок, скажете ви? Але монета зношиться, і Сонце піде наднову до того, як можна буде закінчити нескінченну послідовність. Отже, ми повинні говорити про гіпотетичну нескінченну послідовність. Це підводить до обговорення опорних занять тощо. У філософії все не може вийти так легко. І, до речі, навіщо взагалі існує межа?

Крім того, що робити, якщо моя монета піднімала голови 50% часу протягом першого мільярду років, але потім почала б виходити головами лише у 25% часу (думковий експеримент від Appleby)? Це означає , що по визначенню. Але ми завжди будемо спостерігати F т е д у е н гр у ( Н е д и ) 1 / 2 в протягом наступного мільярда років. Як ви вважаєте, така ситуація насправді не можлива? Звичайно,P(Heads)=1/4Frequencу(Неагс)1/2 але чому?Тому що не може несподівано змінитися? Але це речення безглузде для П-частоліста.П(Неагс)

Я хочу, щоб ця відповідь була короткою, щоб я зупинився тут; див. вище для посилань. Я думаю, що насправді важко бути вболіваючим P-частою.

(Оновлення: У коментарях нижче, @mpiktas наполягає на тому, що визначення частолістів є математично безглуздим. Моя думка, висловлена ​​вище, - це те, що визначення частолістського характеру є філософсько проблематичним.)


Частий підхід до статистики

Розглянемо імовірнісну модель , який має деякі параметри & thetas і дозволяє обчислити вірогідність даних спостережень X . Ви зробили експеримент і спостерігали деякі дані X . Що ви можете сказати про θ ?П(Хθ)θХХθ

S-частота - це положення, що не є випадковою величиною; його справжні цінності в реальному світі є такими, якими вони є. Ми можемо спробувати оцінити їх як - то & thetas , але ми не можемо осмислено говорити про ймовірність & thetas істоти в деякому інтервалі (наприклад , позитивні). Єдине, що ми можемо зробити - це створити процедуру побудови деякого інтервалу навколо нашої оцінки, щоб ця процедура змогла охопити справжнє θ з певною довгостроковою частотою успіху (певна ймовірність).θθ^θθ

Більшість статистичних даних, що використовуються сьогодні в природничих науках, базуються на такому підході, тому сьогодні, безумовно, є багато S-часток.

(Оновлення: якщо ви шукаєте приклад філософа статистики, на відміну від практикуючих статистику, відстоюючи точку зору S-частістів, тоді прочитайте статті Дебори Мейо; +1 до відповіді @ NRH.)


ОНОВЛЕННЯ: Про зв’язок між P-частотою та S-частотою

@fcop та інші запитують про зв’язок між Р-частотою та S-частотою. Чи передбачає одна з цих позицій інша? Немає сумнівів, що історично S-частолізм розроблявся на основі позиції П-частотистів; але чи логічно вони мають на увазі одне одного?

Перш ніж підходити до цього питання, я повинен сказати наступне. Коли я писав вище, що П-частотних лікарів майже немає, я не мав на увазі, що майже всі - Р-суб'єктивні-байесіани-а-ля-де-фінети або Р-пропенситист-а-ля-поппер. Насправді, я вважаю, що більшість статистиків (або науковців даних, або машинобудівників) - це P-взагалі нічого, або P-закриття-обчислення (запозичення відомої фрази Мерміна ). Більшість людей схильні ігнорувати проблеми фундаменту. І це добре. У нас немає хорошого визначення вільної волі, чи інтелекту, ні часу, ні любові. Але це не повинно заважати нам працювати над нейронаукою, або над ШІ, або з фізики, або від закохання.

Особисто я не є S-частотним, але ні в мене є якесь - або послідовне уявлення про фундамент ймовірності.

На відміну від цього, майже кожен, хто робив практичний статистичний аналіз, або S-частоцист, або S-Bayesian (або, можливо, суміш). Особисто я публікував документи, що містять -значення, і я ніколи (до цих пір) не публікував публікацій, що містять пріори та постеріори за параметрами моделі, так що це робить мене S-частою, хоча б на практиці.p

Тому очевидно, що можна бути S-частою діячем, не будучи частішим Р, незважаючи на те, що @fcop каже у своїй відповіді.

Добре. Чудово. Але все-таки: чи може байесіанець Р бути S-частим? І чи може P-частоцист бути S-байесіаном?

Для переконаного П-байсеяна, мабуть, нетипово бути S-частою, але в принципі цілком можливо. Наприклад, Р-байєсиан може вирішити, що вони не мають будь-якої попередньої інформації над і, отже, прийняти S-частотистський аналіз. Чому ні. Кожне твердження S-частолістів, безумовно, може бути інтерпретоване ймовірністю P-байесів.θ

Переконаний P-частоцист бути S-байесіаном, мабуть, проблематично. Але тоді бути дуже переконливим бути переконливим P-частотистом ...


2
Коментарі не для розширеного обговорення; ця розмова перенесена в чат .
Glen_b

13

Робота Колмогорова про основи теорії ймовірності має розділ під назвою «Відношення до експериментальних даних» на стор.3. Про це він написав:

введіть тут опис зображення

введіть тут опис зображення

Він показує, як можна було б вирахувати його Аксіоми, спостерігаючи експерименти. Це досить часті способи інтерпретації ймовірностей.

У нього є ще одна цікава цитата про неможливі події (порожні набори):

введіть тут опис зображення

Отже, я вважаю, що якщо вам зручно з цими аргументами, то ви повинні визнати, що ви частолюдист. Цей ярлик не є ексклюзивним. Ви можете бути двозначними (я сформулював це слово), тобто як частістські, так і байєсівські. Наприклад, я став байєсівським, застосовуючи стохастичні методи до явищ, які не є по суті стохастичними.

ОНОВЛЕННЯ Як я писав раніше в CV, сама теорія Колмогорова сама по собі не є частою. Це так само сумісно з баєсівським видом, як і з частолюдським видом. Він додав цю милу виноску до розділу, щоб зрозуміти, що він утримується від філософії:

введіть тут опис зображення


1
а більшість аксіоматичних систем походять від «абстрагування» або «узагальнення» понять реального світу. Те ж саме стосується поняття (аксіоми) '' метрики '', вони розглядали поняття реального світу (евкільдова відстань) і '' знайшли '' три властивості, які вони використовували як "аксіоми" в метричному просторі. Але ваша відповідь хороша (+1), це свідчить про те, що Колмогоров не "вигадував" свої аксіоми "з повітря", він розробив аксіоматичну систему, яка була пов'язана з розумінням того, що таке поширення було в той час .

1
Ви можете поглянути на коментарі @mpiktas до цього питання і сказати, що сам Колмогоров дав це визначення? дивитись коментарі на stats.stackexchange.com/questions/230415/…

2
@fcop, я пам'ятаю його відповідь. Це здавалося розумним. Можна точно вивести аксіоми Байєса, і Колмогоров показує це в книзі.
Аксакал

1
+1 Саме те, що я мав на увазі (виноска, зокрема), коли писав коментарі до споріднених тем. Також останній коментар @Aksakal
Graeme Walsh

1
@Aksakal: посилаючись на ваш коментар вище: це не відповідь "його", але моя :-)

8

Я вважаю, що доречно згадати про Дебору Майо, яка пише блог « Філософія помилок статистики» .

Я не буду претендувати на глибоке розуміння її філософської позиції, але рамка статистики помилок , описана в роботі з Арісом Спаносом, включає те, що вважається класичними статистичними методами часто. Для цитування статті:

Під парасолькою статистично-статистичних методів помилок можна включати всі стандартні методи, що використовують ймовірності помилок, засновані на відносних частотах помилок при повторному відборі - часто називають теорією вибірки або статистикою частотистів .

А далі в тому ж документі ви можете прочитати це:

Для статистики помилки існує ймовірність не для вимірювання ступенів підтвердження чи переконань (фактичних чи раціональних) у гіпотезах, а для кількісного визначення того, як часто методи здатні розмежовувати альтернативні гіпотези та наскільки надійно вони полегшують виявлення помилки.


2
+1, молодець згадуючи блог Майо. Вона справді є найбільш голосовим філософом статистики, який підтримує статистику часто. Більшість інших рейтингів в Інтернеті за ці дні підтримує байєсівські статистичні дані.
амеба каже: Відновити Моніку

6

Посилаючись на цю тему та коментарі до неї, я думаю, що часто лікарі визначають "ймовірність" події як довгострокову відносну частоту виникнення цієї події. Так що якщоннАААП(А)

П(А): =limн+нАн

Не важко зрозуміти, що це визначення відповідає аксіомам Колмогорова (адже обмеження лінійних лінійних, див. Також. Чи є якась математична * основа для байесівських та частофілістських дискусій? ).

Для того, щоб дати таке визначення, вони повинні "вірити", що ця межа існує. Тож часто лікарі - це ті, хто вірить у існування цієї межі.

EDIT від 31.08.2016: про розмежування S- та P-частотизму

Як @amoeba розрізняє у своїй відповіді між S-частотами та P-частостями, де P-частотори - це тип частоти, який я визначаю supra, і, як він також стверджує, що важко бути P-частою, я додав розділ EDIT стверджувати, що дійсно навпаки;

Я стверджую, що всі S-частотні лікарі є P-частотами .

θ

У своїй відповіді він також зазначає, що Р-частологи - рідкісний вид.

П(СЯ^θ)

Тому, за його визначеннями, кожен S-частоцист також є P-частою. Тому я роблю висновок, що П-частота не є такою рідкісною, як стверджувала амеба.

θθ

θ

θ

Чи можу я також запитати @mpiktas, який пише у своєму коментарі відповідь амеби:

"Дуже важко бути П-частісткою, тому що дати математично обгрунтоване визначення такої ймовірності практично неможливо".

Якщо вам потрібно визначення П-частотизму, щоб визначити S-частотність, то як тоді можна бути більш S-частістським, ніж Р-частотистським?


3
@Tim: чому OLS був би "частим"?

2
Якщо це так, то, здається, все обговорення того, хто є лікарями, не має особливого сенсу, оскільки їх сфера інтересів дуже обмежена, і величезні сфери статистики виходять за межі їх сфери ... (У тому числі багато областей, які цікавлять Байєси.) Що я говорю, це не таке визначення, оскільки воно занадто вузьке.
Тім

2
limн+нАн

1
лiмн+нА/нpНлiмн+нА/нpН

3
Основа теорії ймовірностей саме з цієї причини, тобто для того, щоб дати певні інтерпретації вірогідного математичного підґрунтя. Тепер ви хочете повернутися назад і "винаходити" ймовірність з вашим "частістським" визначенням. Я вважаю це оманливим, тому я спростовую ваші відповіді. Ви можете ігнорувати це, саме так працює сайт, завжди є можливість для незгоди.
mpiktas

4

Дійсно цікаве питання!

Я б поставив себе в таборі частолістів, коли йдеться про розуміння та інтерпретацію тверджень про ймовірність, хоча я не настільки суворий щодо необхідності фактичної послідовності експериментів в ІД, щоб обґрунтувати цю ймовірність. Я підозрюю, що більшість людей, які не купують тезу про те, що "ймовірність є суб'єктивною мірою віри", також би подумала про ймовірність таким чином.

П(Н)=0,50,50,5

0,5

Я вважаю, що вищесказане є досить суперечливим для відвідувачів. Байєсівці будуть більше зосереджені на експерименті, який знаходиться в руці, і менше на довготривалій поведінці: вони заявляють, що ступінь їхньої віри, що наступним жеребком буде голова, - цеП(Н)=0,5

У такому простому випадку, як метання монет, ми можемо побачити, що частофілістський та баєсовський підходи функціонально рівнозначні, хоча і філософсько дуже різні. Як вказував Дікран Марсупіал, Байєсій може насправді використовувати той факт, що емпірично ми бачимо, що монети піднімають голови так само часто, як ми бачимо, що вони піднімають хвости (довгий пробіг / велика частота вибірки як попередня).

Що з речами, які, можливо, не можуть мати тривалі частоти? Наприклад, яка ймовірність, що Північна Корея розпочне війну з Японією в найближчі 10 років? Що стосується часто лікарів, ми насправді залишаємось у спокої, оскільки ми не можемо реально описати розподіл вибірки, необхідний для перевірки такої гіпотези. Байєсівський міг би вирішити цю проблему, розмістивши розподіл ймовірностей за можливостями, найімовірніше, виходячи із залучення експертного внеску.

Однак виникає ключове питання: звідки беруться ці ступені вірування (або припущене значення для довгострокової частоти)? Я б заперечував із психології і сказав, що ці переконання (особливо в районах, далеких від експериментальних даних) походять від того, що називається евристичністю доступності та евристичністю репрезентативності . Є цілий ряд інших, які, ймовірно, вступають у гру. Я аргументую це тим, що за відсутності даних для калібрування наших переконань (у напрямку до спостережуваної довгострокової частоти!), Ми повинні покладатися на евристику, якою б складною ми їх не здавалася.

Вищенаведене психічне евристичне мислення однаково стосується частоліністів та байесів. Що мені цікаво, це те, що незалежно від нашої філософії, в корені ми покладаємо більше віри в те, що, на нашу думку, є більш вірогідним, і ми вважаємо, що це більш вірогідно, тому що ми вважаємо, що існує більше способів щоб це було правдою, або ми уявляємо, що шляхи, що ведуть до його істинності, трапляться частіше (часто :-), ніж ті, які роблять це неправдивим.

Оскільки це рік виборів, давайте візьмемо політичний приклад: яку віру ми б висловили у заяві "Тед Крус запропонує заборонити штурмові гвинтівки протягом наступних 4 років". Тепер у нас є деякі дані про це з його власних тверджень, і ми, швидше за все, покладемо свою попередню віру в правдивість цього твердження майже до нуля. Але чому? Чому його попередні заяви змушують нас мислити саме так? Тому що ми вважаємо, що високоідеологічні люди прагнуть «дотримуватися зброї» більше, ніж колеги-прагматики. Звідки це походить? Ймовірно, з досліджень, проведених психологами, та власного досвіду роботи з дуже принциповими людьми.

Іншими словами, ми маємо деякі дані та переконання, що для більшості випадків, коли хтось, як Крус, міг змінити свою думку, вони цього не зроблять (знову ж таки, багаторічна або велика вибіркова оцінка видів).

Ось чому я «засідаю» з ветеринарами. Це не моя неприязнь до байєсівської філософії (цілком розумної) чи методів (вони чудові!), Але якщо я заглиблююсь досить глибоко в те, чому я дотримуюся переконань, у яких не вистачає сильної підкладки великого зразка, я вважаю, що я покладаюся на якусь подобу ментальної моделі, де результати можуть бути зведені (якщо неявно) або де я можу викликати довгострокові ймовірності в певному підпроцесі (наприклад, республіканці голосують проти заходів контролю зброї X% часу), щоб зважити мою переконання так чи інакше. .

Звичайно, це не зовсім справжній частолізм, і я сумніваюся, що є багато людей, які підписуються на інтерпретацію вірогідності цього листа Візеєм Мізесом. Однак я думаю, що це демонструє основну сумісність між ймовірністю Байесія та частотолога: і те, і інше звертається до нашої внутрішньої евристики щодо доступності або того, що я називаю принципом "Пачінка" щодо частот по ланцюгу причинних зв’язків.

Тож, можливо, я мав би назвати себе "авалібілістом", щоб вказати, що я призначаю ймовірності виходячи з того, як часто я можу уявити подію, що відбувається як результат ланцюга подій (з деякою суворістю / моделюванням, звичайно). Якщо у мене багато даних, чудово. Якщо цього не зробити, то я спробую розкласти гіпотезу на ланцюжок подій і використовувати ті дані, які я маю (анекдотичний або «здоровий глузд», як потрібно), щоб оцінити, наскільки часто я б міг уявити собі таку подію.

Вибачте за довгий пост, чудове запитання BTW!


1
Ви робите величезні спрощення щодо суб'єктивістського підходу до ймовірності. Я погоджуюсь, що психологія відіграє важливу роль у роботі з даними, але ви можете робити суб'єктивно-упереджений аналіз і при частофілістському підході. Деякі байєси стверджують, що у випадку баєсів принаймні ви робите свої суб'єктивні переконання, а не ігноруючи їх.
Тім

1
@ Тим я не говорив, що часто лікарі є більш об'єктивними (див. Мою першу частину про основні припущення щодо відвідувачів). Те, що я вказував, - це те, що і часто, і байєси обґрунтовують свої ймовірності в своїх переконаннях щодо того, як часто щось трапляється або скільки справ має відбутися (і їхня індивідуальна ймовірність зробити це), щоб зробити щось справжнім.

1
@ Тим часом, оскільки це не повідомлення про байезіанство проти частотизму, я сумніваюся, що я дав їх належне ... це займе багато місця на сторінці! По суті, всі ми покладаємось на ментальну евристику, коли думаємо про ймовірність, і ці евристики спонукають нас думати про те, що деякі види події можуть відбуватися «більше способів» або бути «більш доступними в причинній мережі», ніж інші.

1
@Tim OK ... Я додав у деяких мовах, щоб уточнити, коли я переходив від мого (короткого) обговорення байєсіанства до мого основного кола.

4

Як зауважив @amoeba , ми часто визначаємо вірогідність та частотистську статистику . Всі джерела, які я бачив до цих пір, говорять про те, що частота виведення заснована на частістському визначенні ймовірності, тобто розумінні його як обмеження пропорційно заданому нескінченному кількості випадкових малюнків (як уже помітили @fcop та @Aksakal, цитуючи Колмогорова)

П(А)=limннАн

Отже, в основному існує поняття про деяку сукупність, з якої ми можемо повторно взяти вибірку. Ця ж ідея використовується при частому виведенні. Я розглядав класичні статті, наприклад, Єжи Неймана , щоб відстежити теоретичні основи частотистської статистики. У 1937 р. Писав Нейман

πππ

π
) ми говоримо про статистику, який бере вибірку з досліджуваної сукупності.

В іншій роботі (Neyman, 1977) він зазначає, що докази, наведені в даних, потрібно перевірити, дотримуючись повторного характеру досліджуваного явища:

Зазвичай "перевірка" або "валідація" здогаданої моделі полягає у виведенні деяких її частістських наслідків у ситуаціях, які раніше не досліджувались емпірично, а потім у виконанні відповідних експериментів, щоб побачити, чи відповідають їх результати прогнозам. В основному перша спроба перевірки негативна: спостережувані частоти різних результатів експерименту не узгоджуються з моделлю. Однак у деяких щасливих випадках є розумна згода, і людина відчуває задоволення тим, що "зрозумів" це явище, принаймні, якось загальним чином. Згодом незмінно з’являються нові емпіричні висновки, що свідчать про неадекватність оригінальної моделі та вимагають її відмови чи модифікації. І це історія науки!

і ще в одному документі Нейман і Пірсон (1933) пишуть про випадкові вибірки, взяті з фіксованої сукупності

У загальній статистичній практиці, коли спостережувані факти описуються як "вибірки", а гіпотези стосуються "популяцій", для яких були відібрані вибірки, символів вибірок або, як ми їх називаємо, критеріїв, які були використовуються для тестування гіпотез, як правило, фіксуються щасливою інтуїцією.

Статистичні статистики в цьому контексті формалізують наукове обгрунтування, де збираються докази, потім беруться нові зразки для перевірки початкових висновків, і коли ми накопичуємо більше доказів, наш стан знань кристалізується. Знову ж таки, як описав Нейман (1977), процес здійснює наступні кроки

( i ) Емпіричне встановлення очевидно стабільних довгострокових відносних частот (або "частот" для коротких) подій вважається цікавим, оскільки вони розвиваються в природі.
( ii ) Відгадування, а потім перевірка «механізму випадковості», повторна операція якого виробляє спостережувані частоти. Це проблема "частої теорії ймовірностей". Іноді цей крок позначається як «побудова моделі». Природно, що механізм відгаданого шансу є гіпотетичним.
( iii ) Використовуючи механізм гіпотетичного шансу досліджуваного явища для виведення правил коригування наших дій (або «рішень») до спостережень, щоб забезпечити найвищий «показник» успіху. [... "правил коригування наших дій" - це проблема математики, зокрема математичної статистики.

Часто планують свої дослідження, беручи до уваги випадкову природу даних та ідею повторного залучення фіксованої сукупності, вони розробляють свої методи на основі цього та використовують їх для перевірки своїх результатів (Neyman and Pearson, 1933),

Не сподіваючись дізнатися, правдива чи помилкова кожна окрема гіпотеза, ми можемо шукати правила, що керують нашою поведінкою щодо них, дотримуючись яких ми гарантуємо, що, зважаючи на досвід, ми не будемо занадто часто помилятися.

Це пов'язано з принципом повторного відбору проб (Кокс і Хінклі, 1974):

(ii) Сильний принцип повторного відбору проб
Відповідно до принципу сильного повторного відбору вибірки, статистичні процедури повинні оцінюватися за їх поведінкою в гіпотетичних повторах за тих самих умов. Це два аспекти. Заходи невизначеності слід інтерпретувати як гіпотетичні частоти у довгострокових повторах; критерії оптимальності повинні формулюватися з точки зору чутливої ​​поведінки в гіпотетичних повторах.
Аргументом для цього є те, що він забезпечує фізичний зміст величин, які ми обчислюємо, і що він забезпечує тісний взаємозв'язок між аналізом, який ми робимо, і базовою моделлю, що розглядається як реальне "справжній" стан справ.

(iii) Слабкий принцип повторної вибірки
Слабка версія принципу повторного відбору вимагає, щоб ми не дотримувались процедур, які для деяких можливих значень параметрів давали б у гіпотетичних повторах більшу частину часу хибних висновків.

На противагу цьому, використовуючи максимальну ймовірність, ми маємо відношення до вибірки, яку ми маємо , і в випадку Байєса ми робимо висновок на основі вибірки та наших пріорів, і як з'являються нові дані, ми можемо здійснити байєсівське оновлення. В обох випадках ідея повторного відбору проб не є визначальною. Часто відвідувачі покладаються лише на дані, які вони мають (як зауважив @WBT ), але маючи на увазі, що це щось випадкове, і його слід розглядати як частину процесу повторного відбору проб у населення (пригадайте, наприклад, як впевненість визначаються інтервали ).

У періодичному випадку ідея повторної вибірки дозволяє оцінити невизначеність (у статистиці) та дає можливість інтерпретувати події реального життя з точки зору вірогідності .


Як зауваження, зауважте, що ні Нейман (Lehmann, 1988), ні Пірсон (Mayo, 1992) не були такими чистими відвідувачами, як ми могли собі уявити. Наприклад, Нейман (1977) пропонує використовувати емпіричну байєсівську та максимальну ймовірність для оцінки балів. З іншого боку (Майо, 1992),

У відповіді Пірсона (1955 р.) на Фішера (та в інших місцях його роботи) йдеться про те, що в наукових контекстах Пірсон відкидає як низьке довгострокове обґрунтування ймовірності помилок [...]

Тож здається, що важко знайти чистих лікарів навіть серед батьків-засновників.


Неймана, Дж. Та Пірсона, ES (1933). До проблеми найбільш ефективних тестів статистичних гіпотез. Філософські трансакції Королівського товариства A: Математичні, фізичні та інженерні науки. 231 (694–706): 289–337.

Нейман, Дж. (1937). Конспект теорії статистичної оцінки на основі класичної теорії ймовірності. Філ. Транс. Р. Соц. Лонд. А. 236: 333–380.

Нейман, Дж. (1977). Частота ймовірності та статистика. Синтез, 36 (1), 97-131.

Майо, ГД (1992). Чи відкинув Пірсон філософію статистики Неймана-Пірсона? Синтез, 90 (2), 233-262.

Cox, DR та Hinkley, DV (1974). Теоретична статистика. Чапман і Холл.

Леманн, Е. (1988). Єжи Нейман, 1894 - 1981. Технічний звіт № 155. Кафедра статистики, Університет Каліформії.


1
+1 (вже кілька днів тому). Дякуємо, що написали це, тут є кілька хороших цитат, і список посилань дуже корисний. У свою чергу, зараз я оновив свою відповідь у кількох місцях, але здебільшого, врешті-решт, для з'ясування взаємозв'язку між P-та S-частотизмом, як я його бачу. Я, звичайно, погоджуюся, що історично S-freq будувався на ідеях P-freq, як ви тут стверджуєте, але я не думаю, що вони обов'язково тягнуть один за собою.
амеба каже: Відновити Моніку

4

Дозвольте запропонувати відповідь, яка пов'язує це питання з актуальним і дуже практичним значенням - Precision Medicine - і в той же час відповісти на нього буквально так, як його задавали: Хто такі лікарі?

Часті люди - люди, які говорять такі речі, як [1] ​​(наголос мій):

Що означає 10% ризик події протягом наступного десятиліття для людини, для якої вона була створена? Всупереч думці, цей рівень ризику не є особистим ризиком цієї особи, оскільки ймовірність не має сенсу в індивідуальному контексті .

Таким чином, часто лікарі трактують "ймовірність" таким чином, що вона не має значення в єдиному контексті, як у конкретного пацієнта . Моя публікація PubMed Commons щодо [1] вивчає суперечки, які повинні зазнавати члени авторів-учасниць, щоб виявити вигляд імовірнісного поняття, застосовного для догляду за окремим пацієнтом. Спостереження за тим, як і чому вони роблять це, може виявитись дуже повчальним щодо того, хто є учасником . Крім того , в значній мірі ип освітлення подальшого обміну в JAMA секції Letters [2,3] Повчально щодо важливості явного визнання обмежень в поняттях частотних ймовірностей і атакувати їх безпосередньояк такий. (Я шкодую, що багато користувачів CV можуть виявити, що [1] лежить за платною стіною.)

Відмінна і дуже читабельна книга [4] Л. Джонатана Коена відплатила б зусиллям усіх, хто зацікавився питанням ОП. Слід зазначити, що книгу Коена дивним чином цитується [1] у зв'язку з твердженням "ймовірність не має сенсу в індивідуальному контексті", хоча Коен однозначно заперечує цю думку таким чином [4, с49]:

Теоретик частоти також не може стверджувати, що всі важливі ймовірності справді є загальними, а не сингулярними. Часто здається дуже важливим вміти підрахувати ймовірність успіху для апендектомії власної дитини ...


1] Sniderman AD, D'Agostino Sr RB та Pencina MJ. "Роль лікарів в епоху прогнозування аналітики". JAMA 314, вип. 1 (7 липня 2015 р.): 25–26. doi: 10.1001 / джама.2015.6177. PubMed

2] Van Calster B, Steyerberg EW та Harrell FH. «Прогноз RIsk для фізичних осіб». JAMA 314, вип. 17 (3 листопада 2015 р.): 1875–1875. doi: 10.1001 / джама.2015.12215. Повний текст

3] Sniderman AD, D'Agostino Sr RB та Pencina MJ. "Прогноз RIsk для осіб - відповідь". JAMA 314, вип. 17 (3 листопада 2015 р.): 1875–76. doi: 10.1001 / джама.2015.12221. Повний текст

4] Коен, Л. Джонатан. Вступ до філософії індукції та ймовірності. Оксфорд: Нью-Йорк: Clarendon Press; Oxford University Press, 1989. Посилання на відскановані сторінки 46-53 та 81-83


1
2] доступна в Інтернеті: lirias.kuleuven.be/bitstream/123456789/513795/1/…
Тім

Мені подобається, що цитата "ризик можна розглядати як суб'єктивний рівень, в який хтось" вірить ", або" готовий зробити ставку на "виникнення захворювання або події2, так само як одна ставка на майбутні одноразові події в іграх спорту ». Дякуємо за Ваш внесок та довідники.
Тім

2
Це виглядає як гарна відповідь, але я трохи розгублений. Я вважаю, що часто відвідувачі займаються процедурами (експериментами), які теоретично можуть бути виконані нескінченно багато разів. Це не означає, що вони не можуть передбачити наступний викид монети, лише те, що їхні занепокоєння / запевнення зосереджені на процесі. Щоправда, вони би сказали, що "США цьогоріч виграють Кубок світу" - це не те, про що вони могли б нічого сказати, але чи не могли вони сказати щось про апендектомію вашої дитини - це унікальне в колись сенсі, але апендектомія на діти - ні.
Уейн

@Tim, дякую за посилання, яке включає і [2], і [3]. Я відповідно оновив текст своєї відповіді.
Девід К. Норріс

2
@ Вайне, я б припустив, що відповідь амеби вище - з її різницею між статистичними процедурами, зазвичай пов'язаними з "переглядом частоти ймовірності", і самим цим переглядом частоти - відповідає вашим коментарем. Люди можуть використовувати статистичні процедури часто, але все ж інтерпретувати та використовувати отримані ймовірності у фідуціальному чи суб'єктивістському способах. Потрібно лише подивитися на вічну помилку інтерпретації P-значень як "ймовірність, що нульова гіпотеза правдива", щоб побачити, що це так.
Девід К. Норріс

3

"Честота проти Байєсів" від XKCD (під CC-BY-NC 2.5 ), натисніть, щоб обговорити:

'Детектор!  Що сказав би баєсовський статистик, якби я запитав у нього, чи ... '[рулон]' Я - НЕЙТРИНО ДЕТЕКТОР, а не ЛАБІРИНТ-ГУД.  СЕРІЙНО, ВАШИЙ МОЗВИЙ ВІН ВИСТАЛИ?  [рулон] '... так'.

Загальний пункт проілюстрованої тут філософії частолістів - це віра робити висновки про відносну ймовірність подій, що ґрунтуються виключно («чисто») на спостережуваних даних, не «забруднюючи» цей процес оцінки попередньо задуманими уявленнями про те, як все має бути чи не повинно бути. Представляючи оцінку ймовірності, частофіліст не враховує попередніх переконань про ймовірність події, коли є спостереження, що підтверджують обчислення її емпіричної ймовірності. Частиця повинна враховувати цю довідкову інформацію, приймаючи рішення про поріг дій або висновку.

Як писав Дікран Марсуп'ял у короткому коментарі нижче , "Цінний момент, який мультфільм (можливо, ненавмисно) доводить, полягає в тому, що наука справді є більш складною, і ми не можемо просто застосувати" нульовий ритуал ", не замислюючись про попередні знання".

В якості іншого прикладу, намагаючись визначити / оголосити, які теми "в тренді" на Facebook, відвідувачі, швидше за все, вітають більш чисто алгоритмічний підрахунок підходу, до якого Facebook переходить , а не стару модель, де працівники перероблятимуть цей список частково на їх основі власні фонові перспективи щодо того, які теми, на їх думку, "повинні" бути найважливішими.


10
-1. Я люблю XKCD, але без жодних коментарів я боюся, що це буде вводити в оману лише в цій темі. І потрібно досить багато коментарів, щоб правильно пояснити, які питання стосуються цього коміксу. Якщо ви надасте відповідне обговорення, я вилучу голоси.
амеба каже, що повернеться до Моніки

4
α

4
"Нульовий ритуал" - це погане застосування частолістської статистики, але це не є проблемою часто.
Дікран Марсупіал

2
@Dikran Ваші коментарі (неправильно) порівнюють "Частота" з "користувачем NHSTs". Ось така плутанина мене хвилювала.
whuber

3
@luchonacho FWIW тут обговорюється мультфільм XKCD stats.stackexchange.com/questions/43339/… Цінним моментом мультфільму (можливо, ненавмисно) є те, що наука справді є більш складною, і ми не можемо просто застосувати "нуль" ритуал », не замислюючись про попередні знання.
Дікран Марсупіал

3

(Зауваження, стосується лише дотичних питань і веб-сайту.)

Ймовірність стосується об'єктивного стану окремих речей . Речі не можуть мати наміру, і вони отримують свої статуси з Всесвіту. Зрештою, подія (надаючи їй статус) завжди повинна відбуватися: подія вже там здійснилася, навіть якщо вона ще насправді ще не відбулася - минуле майбутнє речі, яке також називають "долею" чи непередбачуваним.

Знову ж , з імовірністю, то факт події - того ж сталося чи ні, не має значення , - це вже є [на відміну від сенсу немає , який ніколи в цій країні]; і як таке воно вже стає непотрібним і зайвим. Факт слід відкинути, а визнання його недійсним - це те, що ми називаємо "подією ймовірною". Будь-який факт про річ несе в собі її первинну непереконливу сторону або ймовірність факту (навіть насправді відбувся факт - ми визнаємо це за допомогою невіри). Ми неминуче «набридли речам» до психічної міри. Тому залишається лише кількісно оцінити часткове заперечення фактичності, якщо потрібно число. Один із способів кількісної оцінки - підрахунок. Інша -зважити . Частіст проводить або уявляє низку випробувань, що лежать перед ним, які він перевертається обличчям, щоб побачити, чи дійсно відбулася подія; він рахує. Баєс розглядає низку психологічних мотивів, що тягнуть за собою його екранізацію; він зважує їх як речі. Обидва чоловіки зайняті грою зарядки / виправдання розуму. Принципово різниці між ними немає.

Можливість - це про потенції мене у світі. Можливість завжди моя (шанс дощу - моя проблема вирішити взяти парасольку або промокнути) і стосується не предмета (того, якого я вважаю можливим або маючи можливість), а всього світу для мене. Можливість завжди 50/50, і це завжди переконливо, тому що це означає - або заклики до, або тягне за собою - моє рішення, як себе вести. Самі речі не мають намірів, а отже, і можливостей. Ми не повинні плутати наші можливості цих речей для нас із власною ймовірністю «стохастичного детермінізму». Ймовірність ніколи не може бути "суб'єктивною" в людському розумінні.


Читач, що спостерігає, може відчути у відповіді масковане копання при яскравій відповіді в цій темі, де @amoeba каже, що думає "there are almost no frequentists of the [probability definition] kind (P-frequentists)". Це могло бути обернено навпаки: байєсівські визначники ймовірності не існують як різні класи. Тому що, як я визнав, байєси розглядають трюки реальності так само, як це роблять часто лікарі - як ряд фактів; тільки ці факти не є експериментами, швидше спогадами про "істини" та "аргументи". Але такі форми пізнання є фактичними і їх можна лише порахувати чи зважити. Ймовірність, яку він споруджує, не синтезується як суб'єктивна, тобто передчуваюча («байєсівська» бути), якщо тільки людське очікування(можливість) виходить на сцену, щоб втрутитися. І @amoeba з тривогою впускає це, коли уявляє, як "монета зношиться, а Сонце піде наднову".


0

Ой, я був учасником багатьох років,
і я весь свій час грав на вуха,
але тепер я повертаюся з Байесом у чудовому магазині,
і я більше ніколи не буду грати в частоліст.

Бо це не ніколи ніколи, ні най ніколи, ні більше,
чи я буду грати в частоліст, ніколи, ні більше!

Я зайшов у лабораторію, де я радився.
Дав мені деякі дані, сказав "p що для нас",
я сказав "Ні в якому разі, Хосе", трохи посміхнувшись,
значення P і очевидно, просто не примиряйся!

Приспів

Я сказав, що за ваш попередній час нам потрібно пролити світло,
і очі дослідника широко відкрилися від захоплення.
Він сказав: "Мої попередні погляди такі ж хороші, як і інші.
І, безумовно, фактор Байєса - це те, що буде найкраще працювати!"

Приспів

Я повернусь до своїх викладачів, зізнаюся, що я зробив,
і попрошу їх помилувати свого блудного сина,
але коли вони пробачили мене, як часто раніше,
я більше ніколи не буду грати в частоліста!

Приспів

І це ні, ніколи ніколи, ні най ніколи більше,
чи я буду грати в частоліст, ніколи, ні більше!

Джерело: А. Е. Рафтері, у книзі "Байезійські пісні", під редакцією Б. П. Карліна, за адресою http://www.biostat.umn.edu/ . Співається під традиційну народну мелодію «Дикий ровер». Цитується у Відкритому університеті M347 Математична статистика, блок 9.


2
Про це слід сказати тут: stats.stackexchange.com/questions/1337/statistics-jokes
Тім

Погодьтеся з @Tim та -1, тому що я не бачу, як це додає до цієї дискусії.
амеба каже, що повернеться до Моніки
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.