Приклади байєсівського та частолістського підходу дають різні відповіді


54

Примітка: Я перебуваю в курсі філософських відмінностей між байєсівської і частотної статистикою.

Наприклад, "яка ймовірність того, що монета на столі є головами" не має сенсу в частоталістичній статистиці, оскільки вона має або посаджені голови, або хвости - нічого ймовірного в цьому немає. Тож на це питання немає відповіді у частістських термінах.

Але така різниця конкретно не є різницею, про яку я прошу.

Швидше, я хотів би знати, як їхні прогнози на добре сформовані питання насправді відрізняються в реальному світі, виключаючи будь-які теоретичні / філософські відмінності, такі як приклад, про який я згадував вище.

Іншими словами:

Що приклад питання, підзвітний в обох частотної і байєсівської статистикою, відповідь на який відрізняється між цими двома?

(наприклад, можливо, один з них відповідає "1/2" на певне запитання, а інший відповідає "2/3".)

Чи є такі відмінності?

  • Якщо так, то які приклади?

  • Якщо ні, то коли це насправді коли-небудь має значення, чи використовую я баєсовську чи частолістську статистику при вирішенні певної проблеми?
    Чому я б уникав одного на користь іншого?


8
Джон Крушке щойно випустив два відео, де він порівнює байєсівські та стандартні статистичні методи. У нього є багато прикладів, коли метод Байєса відкидає, але стандартний метод цього не робить. Можливо, не саме те, що ви шукали, але все одно ... youtu.be/YyohWpjl6KU та youtu.be/IhlSD-lIQ_Y .
Rasmus Bååth

4
Біноміальний розподіл дає ще один приклад, коли часті (засновані на ймовірності) умовиводи та байєсівські умовиводи відрізняються в деяких випадках. Імовірність профілю параметра не знижується до як ( див. ) Для деяких зразків. Це означає, що деякий вірогідний вірогідний інтервал має нескінченну тривалість. З іншого боку, граничний задній розподіл завжди розпадається на як враховуючи, що він інтегрується. N0NN0N

@Procrastinator: Дякую, я зараз переглядаю згадані слайди. Це здається трохи більш інтенсивним, ніж моє математичне підґрунтя, але, сподіваюся, я щось із цього вийду. :)
Мехрдад

2
Ви можете поглянути на приклад Стоун. Я пояснюю це на своєму блозі тут: normaldeviate.wordpress.com/2012/12/08/…
Ларрі Васерман

1
@mbq: Цікаво, чому це було зроблено вікі спільноти?
Мехрдад

Відповіді:


9

Цей приклад взято звідси . (Я навіть думаю, що я отримав це посилання від SO, але більше не можу його знайти)

Монета була кинута разів, піднімаючи голови разів. Якщо його потрібно кинути вдвічі більше, ти зробив би ставку на дві голови? Припустимо, що ви не побачите результат першого жеребкування перед другим жеребкуванням (а також незалежно, що залежить від ), щоб ви не могли оновити свою думку щодо між двома кидками.n=14k=10θθ

За незалежністю Тоді, прогнозний розподіл із заданим -prior, стає

f(yf,1=heads,yf,2=heads|θ)=f(yf,1=heads)f(yf,2=heads|θ)=θ2.
Beta(α0,β0) Бета(1,1)(10/14)20,51
f(yf,1=heads,yf,2=heads|y)=f(yf,1=heads,yf,2=heads|θ)π(θ|y)dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)θ2θα0+k1(1θ)β0+nk1dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)Γ(α0+k+2)Γ(β0+nk)Γ(α0+β0+n+2)=(α0+k)(α0+k+1)(α0+β0+n)(α0+β0+n+1)
Для рівномірного попереднього ( aBeta(1,1)-пріор), це дає приблизно .485. Отже, ви, швидше за все, не зробите ставку. Виходячи з MLE 10/14, ви могли б обчислити ймовірність двох голів , так що ставки мали б сенс.(10/14)2.51

+1 саме таку відповідь, яку я шукав, дякую.
Мехрдад

5
Насправді було оновлення публікації, на яку посилався у відповіді ... Хоча він і залишив цю посаду, "замість того, щоб використовувати рівномірний розподіл як попередній, ми можемо бути ще більш агностичними. У цьому випадку ми можемо використовувати Beta ( 0,0) розподіл як попередній. Такий розподіл відповідає тому випадку, коли будь-яке середнє значення розподілу однаково вірогідне. У цьому випадку два підходи, байєсівський і частолістський, дають однакові результати ". !!! Тож нам ще потрібен приклад, щоб відповісти на це питання! Отже, +1 до відповіді нижче як справжня відповідь на це питання.
користувач1745038

10

Дивіться тут моє запитання , в якому згадується стаття Едвіна Джейнеса, яка наводить приклад правильно побудованого періодичного довірчого інтервалу, де у вибірці є достатня інформація, щоб точно знати, що справжнє значення статистики ніде не знаходиться в інтервалі довіри ( і таким чином інтервал довіри відрізняється від достовірного інтервалу Байєса).

Однак причиною цього є різниця у визначенні довірчого інтервалу та достовірного інтервалу, що, в свою чергу, є прямим наслідком різниці частото-баєсівських визначень ймовірності. Якщо ви попросите байєсів створити байєсівський довірчий (а не достовірний) інтервал, тоді я підозрюю, що завжди буде пріоритет, для якого інтервали будуть однаковими, тому різниці не залежать від вибору попереднього.

Чи підходять частофілістські чи байєсівські методи, залежить від питання, яке ви хочете поставити, і в кінці дня саме відповідь вирішує відповідь (за умови, що необхідні обчислювальні та аналітичні зусилля не враховуються).

Будучи дещо язиком у щоках, можна стверджувати, що частота тривалого бігу є цілком розумним способом визначення відносної правдоподібності пропозиції, і в цьому випадку частофілістська статистика є дещо дивним підмножиною суб'єктивного байєсіанства - тому на будь-яке питання, на який може звернутись учасник, суб'єктивістський баєсій також може відповісти тим самим, або яким-небудь іншим чином вони повинні обирати різних пріорів. ; o)


4
Використання «суб’єктивного байєсівця» - це трохи саботаж ( див. ). Моделювання в цілому сповнене суб'єктивізму, вибір розподілу для моделювання зразка також суб'єктивний. Навіть вибір тесту на придатність, щоб перевірити, чи певна модель розумний, є суб'єктивним.

2
Я не дуже з цим погоджуюся, якщо хтось вважає "суб'єктивним" сприятливим, це їх помилка. Іноді, коли ми маємо на увазі ймовірність, ми дійсно маємо на увазі суб'єктивну особисту переконання - я не бачу причин не називати це тим, що якщо саме це мається на увазі (вибір прийняти лише довгострокові частоти, оскільки визначення ймовірності є суто суб'єктивним вибором).
Дікран Марсупіал

1
+1 спасибі за посилання, це дуже підбадьорливо. А також для замітки про різницю між достовірністю та надійними інтервалами.
Мехрдад

8

Я вважаю, що цей документ забезпечує більш цілеспрямоване розуміння компромісів у фактичних програмах між ними. Частина цього може бути пов'язана з моєю перевагою інтервалів, а не тестів.

Густафсон, П. і Ґренландія, С. (2009). Інтервальна оцінка даних безладної спостереження . Статистична наука 24: 328–342.

Що стосується інтервалів, можливо, варто пам’ятати, що частотні довірчі інтервали вимагають / вимагають рівномірного покриття (точно або принаймні велике, ніж x% для кожного значення параметра, що не має нульової ймовірності), і якщо вони не мають це - вони насправді не мають довірчих інтервалів. (Деякі йдуть далі і кажуть, що вони також повинні виключати відповідні підмножини, які змінюють покриття.)

Байєсівське покриття, як правило, визначається розслабленням, що "середнє покриття", враховуючи припущення, що попереднє, виявляється абсолютно правильним. Густафсон та Ґренландія (2009) називають цих всемогутних пріорів та вважають помилковими для кращої оцінки.


1
+1 Я ніколи не знав про цю різницю обмежень, дякую, що вказав на це.
Мехрдад

3

Якби хтось ставив запитання, яке має як частість, так і байєсівську відповідь, я підозрюю, що хтось інший зміг би визначити неоднозначність у питанні, таким чином, зробивши його не "добре сформованим".

Іншими словами, якщо вам потрібна частофілістська відповідь, використовуйте методи частості. Якщо вам потрібна байєсівська відповідь, використовуйте байєсівські методи. Якщо ви не знаєте, що вам потрібно, то, можливо, ви не визначилися однозначно.

Однак в реальному світі часто існує кілька різних способів визначити проблему або задати питання. Іноді незрозуміло, який із цих способів є кращим. Це особливо часто, коли клієнт статистично наївний. В іншому випадку на одне питання набагато складніше відповісти, ніж на інше. У таких випадках людина часто йде з найпростішим, намагаючись переконатись, що його клієнти точно погоджуються з тим, яке питання він задає або яку проблему він вирішує.


3

Рекомендую переглянути вправу 3.15 вільно доступних алгоритмів інформаційних підручників , алгоритмів викладання та навчання від MacKay.

Бельгійська монета за один євро, коли вона крутилася на межі 250 разів, піднімала голови в 140 разів, а хвости - 110. "Мені це здається дуже підозрілим", - сказав Баррі Біла, викладач статистики в Лондонській школі економіки. "Якби монета була неупереджена, шанс отримати результат такий екстремальний, як це було б менше 7%". Але чи свідчать ці дані, що монета є упередженою, а не справедливою?

Приклад детально опрацьовано на с. 63-64 підручника. Висновок полягає в тому, що -значення становить , але байєсівський підхід дає різні рівні підтримки для будь-якої гіпотези, залежно від попереднього. Це варіюється від рекомендованої відповіді без жодних доказів того, що монета є упередженою (коли використовується плоскість) до відповіді не більше проти нульової гіпотези про неупередженість у випадку, якщо використовується штучно екстремальний попередній час.0,07 6 : 1p0.076:1

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.