Суб'єктивність у статистиці частотних лікарів


14

Я часто чую твердження, що байєсівська статистика може бути дуже суб’єктивною. Основним аргументом є те, що висновок залежить від вибору попереднього (навіть якщо можна вибрати принцип байдужості або максимальної ентропії для вибору попереднього). Для порівняння, стверджує твердження, часто-часто статистика є більш об'єктивною. Скільки правди в цьому твердженні?

Крім того, це мене здивує:

  1. Які конкретні елементи частофілістської статистики (якщо такі є) можуть бути особливо суб’єктивними і які відсутні або мають менш важливе значення в байєсівській статистиці?
  2. Чи є суб'єктивність більш поширеною у байєсівській, ніж у частофілістській статистиці?

5
Безумовно, частістські методи набагато більш суб'єктивні, ніж рекламовані, але я заперечую, що байєсівські методи все ж більш суб'єктивні. І, будь ласка, не переконуйте себе, що інваріантність вашого попередника під групою або специфікація попереднього MaxEnt є якимось "об'єктивним" - обидва типи попередньо потенційно висловлюють переконання, які я вважаю інформативними, і в будь-якому випадку жодна стратегія не застосовується в повній загальності (наприклад, я не думаю, що в просторі CDF є інваріантні або MaxEnt пріори, і будь-який попередній на цьому просторі призначає ймовірність 1 топологічно мізерному набору).
хлопець

2
Байєси починаються на суб'єктивному ґрунті, потім дані (сподіваємось) відтягують їх назад у об'єктивну реальність. Часті фахівці починають (або, принаймні, думають, що це роблять) з об'єктивних позицій, але потім закінчують піддавати аналізу свої суб'єктивні припущення.
Аксакал

2
Баєси знають і випереджають свої припущення. Часто лікарі - ні.
Олексій

Відповіді:


15

Я часто чую твердження, що байєсівська статистика може бути дуже суб’єктивною.

Так само я. Але зауважте, що існує велика двозначність у тому, щоб називати щось суб’єктивним.

Суб'єктивність (обидва почуття)

Суб'єктив може означати (принаймні) одного із

  1. залежить від ідіосинкратії дослідника
  2. явно стосується стану знань окремої людини

Байєсіанство є суб'єктивним у другому розумінні, оскільки воно завжди пропонує спосіб оновлення переконань, представлених розподілом ймовірностей, обумовлюючи інформацію. (Зауважте, що це переконання - це переконання, які певний суб'єкт насправді має, або просто вірування, які суб'єкт міг би мати, не має значення для вирішення, чи є вони "суб'єктивними".)

Основним аргументом є те, що висновок залежить від вибору попереднього

Насправді, якщо пріоритет представляє вашу особисту віру в щось, то ви майже напевно цього не вибрали більше, ніж ви вибрали більшість своїх переконань. І якщо це відображає чиїсь переконання, то це може бути більш-менш точне представлення цих переконань, тому за іронією долі буде досить "об'єктивний" факт про те, наскільки добре він їх представляє.

(навіть якщо можна вибрати принцип байдужості або максимальної ентропії для вибору попереднього).

Можна, хоча це не має тенденції узагальнювати дуже гладко до безперервних доменів. Крім того, напевно, неможливо одразу бути рівним або «байдужим» у всіх параметрах (хоча я ніколи не був впевнений, чому ти цього хочеш бути).

Для порівняння, стверджує твердження, часто-часто статистика є більш об'єктивною. Скільки правди в цьому твердженні?

То як би ми могли оцінити цю претензію?

Я припускаю, що в другому другому сенсі суб'єктивне: це здебільшого правильно. І в першому сенсі суб'єктивне: це, мабуть, помилково.

Частотність як суб'єктивна (друге почуття)

Деякі історичні деталі корисні для відображення проблем

Для Неймана та Пірсона існує лише індуктивна поведінка, не індуктивний висновок, і всі статистичні оцінки працюють із властивостями вибірки на тривалий термін. (Отже, аналіз альфа та потужності, але не значення p). Це досить непредметно в обох сенсах.

Дійсно, можна, і я вважаю цілком обґрунтованим, стверджувати, що часто частость не є загальним висновком, а сукупністю критеріїв оцінки всіх можливих процедур висновку, що підкреслює їх поведінку при повторному застосуванні. Простими прикладами можуть бути послідовність, неупередженість і т. Д. Це робить його очевидно непредметнім у сенсі 2. Однак він також ризикує бути суб'єктивним у сенсі 1, коли нам доведеться вирішити, що робити, коли ці критерії не застосовуються (наприклад, коли немає неупереджений оцінювач, який має бути) або коли вони застосовуються, але суперечать.

Фішер запропонував менш неефективний частотанізм, що цікаво. Для Фішера існує таке поняття, як індуктивний умовивід, в тому сенсі, що суб'єкт, вчений, робить висновки на основі аналізу даних, зробленого статистиком. (Отже, p-значення, але не альфа-аналіз та потужність). Однак рішення про те, як себе вести, чи продовжувати дослідження тощо, приймає вчений на основі її розуміння теорії домен, а не статистиком, що застосовує парадигму висновку. Через цей фішерський розподіл праці як суб'єктивність (сенс 2), так і окремий предмет (сенс 1) сидять на стороні науки, а не на статистичній стороні.

Юридично кажучи, частота рибалки є суб'єктивною. Просто суб'єктивний суб'єкт не є статистиком.

Доступні різні синтези, як ледь узгоджена суміш цих двох, що ви знайдете у підручниках прикладної статистики, так і в більш нюансованих версіях, наприклад, "Статистика помилок", яку відправила Дебора Мейо. Останнє в сенсі 2 є досить суб'єктивним, але дуже суб'єктивним у сенсі 1, оскільки досліднику доводиться використовувати наукове судження - стиль Фішера - щоб зрозуміти, які значення ймовірностей помилок мають бути перевірені.

Частотність як суб'єктивний (перший сенс)

Тож чи часто періодизм є менш суб'єктивним у першому розумінні? Це залежить. Будь-яка процедура висновку може бути прорізана ідіосинкратіями, як це фактично застосовується. Тож, можливо, корисніше запитати, чи заохочує частость до менш суб'єктивного (першого сенсу) підходу? Я сумніваюся в цьому - я думаю, що самосвідоме застосування суб'єктивних (другого сенсу) методів призводить до менш суб'єктивних (першого сенсу) результатів, але це можна аргументувати будь-яким способом.

Припустимо, на мить, що суб'єктивність (перший сенс) проникає в аналіз за допомогою "вибору". Байєсіанство, мабуть, передбачає більше «вибору». У найпростішому випадку вибір розраховується як: один набір потенційно ідіосинкратичних припущень для частотолога (функція ймовірності або еквівалент) і два набори для байєсів (ймовірність і пріоритет над невідомими).

Однак байєси знають, що вони є суб'єктивними (у другому розумінні) щодо всіх цих виборів, тому вони можуть бути більш усвідомленими щодо наслідків, які повинні призвести до меншої суб'єктивності (у першому розумінні).

Навпаки, якщо шукати тест у великій книзі тестів, то можна скласти відчуття, що результат є менш суб'єктивним (перше почуття), але, мабуть, це результат заміни розуміння іншим суб'єктом проблеми на власну. . Не ясно, що такий спосіб стає менш суб'єктивним, але це може відчувати саме так. Я думаю, що більшість погодиться, що це не корисно.


4
Визначення словника "суб'єктивне" (прямо від Google) говорить: ґрунтується на особистих почуттях, смаках чи думках чи впливає на них. наприклад, "його погляди - високо суб'єктивні" синоніми: особистісні, персоналізовані, індивідуальні, внутрішні, емоційні, інстинктивні, інтуїтивні, імпресіоністичні . Зауважте, що це відображає фольклорну теорію про те, що "погляд" (тобто переконання) є суб'єктивним (сенс 1: імпресіоністичний, інтуїтивний, дивний тощо), оскільки це стосується внутрішнього стану певного предмета (сенс 2: персоналізований, індивідуальний тощо) .), а не бути публічним, тобто безособовим .
кон'югатприор

2
Можливо, було б корисно подумати про когнітивну психологію як про приклад. Це поле є повністю суб'єктивним (у другому сенсі, тому що це все про внутрішні стани людей і їх вплив на поведінку цих людей) , але це НЕ суб'єктивне в першому сенсі, тому що психологи не можуть на насправді просто сидіти і роблять речі на основи власного внутрішнього стану.
кон'югатпріор

2
Протилежний край, де щось абсолютно ідіосинкратичне та суб'єктивне (сенс 1), але насправді не про предмет, це важче знайти. Можливо, Лукрецій, що пояснює атоми і порожнечу в de Rerum Naturae, є прикладом.
кон'югатприор

1
Саме так. Англійська з цього приводу зовсім не допомагає ...
кон'югатпріор

1
і я схвалив (і трохи відкоригував) запропоновану зміну
кон'югат

6

Суб’єктивність у частофілістських підходах є надзвичайно поширеною у застосуванні умовиводу. Під час перевірки гіпотези ви встановлюєте рівень довіри, скажімо, 95% або 99%. Звідки це походить? Це не з будь-якого місця, а з ваших власних уподобань чи переважаючої практики у вашій галузі.

У великих наборах даних дуже мало байєсівських питань, тому що, коли ви оновлюєте його даними, задній розподіл відпливе від вашого попереднього, оскільки все більше і більше даних обробляються.

Сказавши, що байєси починають від суб'єктивного визначення ймовірностей, переконань і т. Д. Це відрізняє їх від часто відвідувачів, які думають з точки зору об'єктивних ймовірностей. У невеликих наборах даних це має значення

ОНОВЛЕННЯ: Сподіваюся, ви ненавидите філософію так само, як і я, але вони час від часу мають цікаву думку, вважаючи суб'єктивізм . Звідки я знаю, що я справді на SE? Що робити, якщо це моя мрія? і т.д. :)


1
Окрім вибору рівня довіри до тестування гіпотез (оскільки те саме можна було б стверджувати і в статистиці Баєса, наприклад, коли вибирали критерії порівняння HDP / HDI з ROPE для відхилення або прийняття гіпотези ), суб'єктивність грає роль у отримання бальної оцінки або отримання довірчих інтервалів, можливо, у виборі оцінювачів?
Амеліо Васкес-Рейна

1
Крім того, я розумію, що рівні значущості встановлюються в статистиці частотних лікарів у контексті прийняття рішень (тобто, чи слід відкидати нульову гіпотезу?), А не при ймовірності обчислення. У теорії рішень Байєса те ж саме можна було б стверджувати про вибір функції втрати, яка може впливати на оптимальне (обране) рішення. Більше того, значення рівня довіри зазвичай вибирають із прийнятного показника помилок типу I (наприклад, 95% у NHST безпосередньо встановлюється з помилково позитивного показника "не вище 5%")
-Reina

4
Безумовно, попередні питання досить небагато при аналізі великих наборів даних для найбільш цікавих сучасних проблем. Щоправда, ми маємо асимптотичні результати, колин і pн, але зазвичай люди з великими наборами даних задають великі запитання, щоб у певному сенсі p зі швидкістю, порівнянною з н, і тут відповідний пріоритет буде діяти як регулятор і матиме велике значення.
хлопець

5
Можливо, варто відзначити, що функції втрат можуть бути не суб'єктивними (тобто повністю визначаються контекстом), і в цьому випадку оптимальні рішення Байєса можуть бути цілком об'єктивними, крім попередніх.

1
@Matthew Так, хоча це також стосується вибору αв NHST від максимально допустимої помилкової позитивної норми, як я вже згадував вище.
Амеліо Васкес-Рейна
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.