Чи справді байєсівська статистика є поліпшенням порівняно з традиційною (частою) статистикою для поведінкових досліджень?


19

Під час відвідування конференцій прихильники байєсівської статистики мали певний поштовх для оцінки результатів експериментів. Він оцінюється як більш чутливий, відповідний та вибірковий щодо справжніх висновків (менше помилкових позитивних результатів), ніж частофілістська статистика.

Я дещо дослідив цю тему, і поки що я не переконаний у користі використання байєсівської статистики. Байесівські аналізи використовували для спростування досліджень Даріла Бема , що підтримують попереднє пізнання, тому я залишаюсь обережно цікавим, як баєсовські аналізи можуть принести користь навіть моїм власним дослідженням.

Тож мені цікаво таке:

  • Влада в баєсівському аналізі проти частого аналізу
  • Сприйнятливість до помилки типу 1 у кожному типі аналізу
  • Компроміс у складності аналізу (баєсівський здається складнішим) порівняно з отриманими вигодами. Традиційні статистичні аналізи є простими, з чітко сформованими рекомендаціями для висновку. Простота може розглядатися як користь. Чи варто цього відмовитися?

Дякуємо за будь-яке розуміння!


1
Байєська статистика - це традиційна статистика - чи можете ви навести конкретний приклад того, що ви маєте на увазі як традиційна статистика?

1
@OphirYoktan: Він говорить про ймовірність частоти та ймовірність Баєса. Це навіть згадується у назві питання.

5
Я думаю, що це питання слід перенести сюди: stats.stackexchange.com
Mark Lapierre

2
Я задав питання по мета про те, чи повинно це бути на тему.

1
Я думаю, що на це питання потенційно може бути відповідь "хороша" чи "правильна". Наприклад , якщо хто - то може сказати , «для кожного тесту з частотної 1 типу помилку і тип 2 помилки & beta ; , існує тест байєсівського з 1 типом помилка альфа і типу 2 помилкою β - х », це було б хороший відповідь. Або щось на кшталт "кожен тест на періодизм є еквівалентним байєсівському тесту з попереднім неінформативним". Тобто це не повинно бути релігійною війною між відвідувачами та байєсами. Я сперечаюся лише тому, що не розумію, як відповіді стосуються конкретних питань в ОП. αβαβx
SheldonCooper

Відповіді:


14

Швидка відповідь на мічений вміст:

1) Помилка потужності / типу 1 в байєсівському аналізі проти частого аналізу

Якщо говорити про тип 1 та потужність (тобто один мінус ймовірність помилки типу 2), то це означає, що ви можете поставити свою проблему з висновком у рамку повторної вибірки. Ти можеш? Якщо ви не можете, то не існує великого вибору, як відійти від частолістських інструментів виводу. Якщо ви можете, і якщо поведінка вашого оцінювача щодо багатьох подібних зразків є актуальною, і якщо ви не особливо зацікавлені в тому, щоб робити заяви про ймовірність щодо конкретних подій, то я не маю жодних вагомих причин рухатися.

Аргумент тут не в тому, що подібних ситуацій ніколи не виникає, - звичайно, вони трапляються - але в тому, що вони зазвичай не виникають у полях, де застосовуються методи.

2) Компроміс за складністю аналізу (баєсівський здається складнішим) порівняно з отриманими вигодами.

Важливо запитати, куди йде складність. У періодичних процедурах реалізація може бути дуже простою, наприклад, мінімізувати суму квадратів, але принципи можуть бути довільно складними, як правило, обертаються навколо того, який оцінювач (и) вибрати, як знайти правильний тест (и), що думати, коли вони не згодні. Для прикладу. дивіться все ще жваву дискусію, підібрану на цьому форумі, різних інтервалів довіри на пропорцію!

У процедурах Байєса реалізація може бути довільно складною навіть у моделях, схожих на те, що вони "повинні" бути простими, як правило, через складні інтеграли, але принципи надзвичайно прості. Це, скоріше, залежить, де ви хочете бути безладдям.

3) Традиційний статистичний аналіз є простим, з чітко сформованими вказівками для висновку.

Особисто я вже не пам'ятаю, але, безумовно, мої учні ніколи не знаходили цього прямо, в основному через принципи розповсюдження, описаного вище. Але питання полягає не в тому, чи процедура є простою, а чи ближче до правильності, враховуючи структуру проблеми.

Нарешті, я категорично не погоджуюся з тим, що в будь-якій парадигмі існують "чітко встановлені вказівки для висновків". І я думаю, що це гарна річ. Звичайно, "знайти p <.05" - це чітке керівництво, але для якої моделі, з якими виправленнями тощо? А що робити, коли мої тести не згодні? Тут потрібні наукові чи технічні судження, як і в інших місцях.


Я не впевнений, що запитання про помилки типу 1 / типу 2 передбачає щось про рамки повторної вибірки. Здається, що навіть якщо мою нульову гіпотезу не вдасться пробити вибірку неодноразово, все одно доцільно запитати про ймовірність помилки типу 1. Імовірність у цьому випадку, звичайно, не над усіма можливими гіпотезами, а скоріше над усіма можливими вибірками з моєї єдиної гіпотези.
SheldonCooper

Мені здається, загальний аргумент такий: хоча помилка 1 (або 2) типу 1 може бути визначена для висновку "один кадр" (Тип 1 проти 2 - лише частина типології помилок, які я можу зробити), якщо не що робить цю помилку вбудованою у повторних випробуваннях, жоден тип помилки не може мати частоту вибору.
кон'югатприор

Що я говорю, це те, що помилка типу 1 (або 2) завжди вкладається в повторні випробування. Кожне випробування є вибірковою сукупністю спостережень з нульової гіпотези. Тож навіть якщо важко уявити вибірку різної гіпотези, повторні випробування все ще існують, тому що легко уявити вибірку різного набору спостережень із тієї самої гіпотези.
SheldonCooper

1
Загадай мені це: як можна вирішити "що є випадковим?" Скажімо, у вас є урна, хтось відбирає пробу "навмання" з урни. Припустимо також, що "розумний спостерігач" також присутній, і вони знають точний вміст урни. Чи є вибірка ще "випадковою", хоча "розумний спостерігач" може з упевненістю передбачити, що саме буде проведено? Чи змінилося щось про урну, якщо їх більше немає?
ймовірністьлогічний

1
Проблема, що виникає у мене з "повторним" характером лікарів, полягає в тому, що для роботи умови повинні залишатися тими ж. Але якщо умови залишаються тими ж, ви зможете об'єднати свої набори даних разом і отримати кращу оцінку. Частіст ігнорує минулу інформацію саме за умов, коли розумно її врахувати.
ймовірністьлогічний

5

Байєсівська статистика може бути виведена з кількох логічних принципів. Спробуйте шукати "ймовірність як розширена логіка", і ви знайдете більш глибокий аналіз основ. Але в основному баєсовська статистика спирається на три основні "дезидерати" або нормативні принципи:

  1. Достовірність пропозиції має бути представлена ​​єдиним дійсним числом
  2. p(A|C(0))C(0)C(1)p(A|C(1))>p(A|C(0))p(B|AC(0))=p(B|AC(1))p(AB|C(0))p(AB|C(1))p(A¯|C(1))<p(A¯|C(0))
  3. Вірогідність пропозиції повинна обчислюватися послідовно . Це означає: a) якщо правдоподібність може бути аргументована більш ніж одним способом, всі відповіді повинні бути однаковими; б) У двох проблемах, коли нам подають однакову інформацію, ми повинні призначити однакові ймовірності; і c) ми повинні враховувати всю наявну інформацію. Ми не повинні додавати інформацію, якої немає, і ми не повинні ігнорувати інформацію, яку ми маємо.

Ці три дезидерати (поряд із правилами логіки та теорії множин) однозначно визначають суму та правила добутку теорії ймовірностей. Таким чином, якщо ви хочете міркувати згідно з цими вищезгаданими трьома дезидератами, вони повинні прийняти байєсівський підхід. Вам не потрібно приймати "байєсівську філософію", але ви повинні прийняти числові результати. Перші три глави цієї книги більш детально описують їх та надають докази.

І останнє, але не менш важливе, "Байєсівське обладнання" - це найпотужніший у вас інструмент для обробки даних. В основному це пояснюється тим, що desiderata 3c) використовує всю наявну інформацію (це також пояснює, чому Байєс може бути складнішим, ніж не-Байєс). За допомогою вашої інтуїції може бути досить важко вирішити "що має значення". Теорема Байєса робить це за вас (і це робиться без додавання довільних припущень, також через 3с).

H0H1L1H0L2H0

  1. P(H0|E1,E2,)Ei
  2. P(H1|E1,E2,)
  3. O=P(H0|E1,E2,)P(H1|E1,E2,)
  4. H0O>L2L1

H0O>>1H1O<<1O1

Тепер якщо обчислення стає "занадто жорстким", то вам потрібно або наблизити числа, або ігнорувати якусь інформацію.

Для фактичного прикладу з відпрацьованими номерами дивіться мою відповідь на це питання


3
Я не впевнений, як це відповідає на питання. Звичайно, часто в цьому списку не згодні десидерат 1, тому решта аргументів до них не стосується. Він також не дає жодного конкретного питання в ОП, наприклад "чи баєсовський аналіз більш потужний або менш схильний до помилок, ніж частофілістський аналіз".
SheldonCooper

@sheldoncooper - якщо частоліст не погоджується з desideratum 1, то на якій основі вони можуть побудувати 95% довірчий інтервал? Вони повинні вимагати додаткову кількість.
ймовірністьлогічний

@sheldoncooper - і далі, ймовірності вибірки доведеться переосмислити, оскільки вони також є лише одним числом. Частіоніст не може відкинути desideratum 1, не відкидаючи власну теорію
ймовірністьлогічний

1
p(H1|...)p(E1,E2,...|H0)H0

1
"вони не можуть відкинути desideratum 1, не відкидаючи власну теорію" - що ви розумієте під цим? Часто не мають поняття "правдоподібність". Вони мають поняття "частота зустрічальності при повторних випробуваннях". Ця частота задовольняє умовам, подібним до ваших трьох дезидератів, і, таким чином, дотримується подібних правил. Таким чином, для будь-якого, для якого визначено поняття частоти, ви можете без проблем використовувати закони ймовірності.
SheldonCooper

2

Я сам не знайомий з байєсівською статистикою, але я знаю, що в Керівництві скептиків до Всесвіту епізод 294 є інтерв'ю з Еріком-Яном Вагенмейкером, де вони обговорюють байєсівську статистику. Ось посилання на подкаст: http://www.theskepticsguide.org/archive/podcastinfo.aspx?mid=1&pid=294

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.