Як баєси порівнюють розподіли?


25

Отже, я вважаю, що я гідно розумію основи частого періодичного вірогідності та статистичного аналізу (і як погано це можна використовувати). У частістському світі є сенс задати таке питання, як "чи відрізняється цей розподіл від такого розподілу", оскільки дистрибуції вважаються реальними, об'єктивними та незмінними (як мінімум для даної ситуації), і тому ми можемо рахувати з'ясується, наскільки ймовірним є те, що один зразок береться з розподілу, схожого на інший зразок.

У байєсівському світогляді нас хвилює лише те, що ми очікуємо побачити, враховуючи наш минулий досвід (я все ще трохи розпливчастий у цій частині, але я розумію концепцію оновлення Баєса). Якщо це так, то як баєсів може сказати, "цей набір даних відрізняється від набору даних"?

Для цілей цього питання я не переймаюся статистичною значимістю чи подібним, а як кількісно оцінити різницю. Мене однаково цікавлять параметричні та непараметричні розподіли.


Чи можете ви пояснити, що ви маєте на увазі під цим набором даних, який відрізняється від набору даних? Як, наприклад, ви маєте на увазі порівняння двох або більше груп, таких як доходи чоловіків порівняно з доходами жінок? А може, як баєс порівнює два зразки доходів без знання статі?
ramhiser

2
@ JohnA.Ramey: У чому різниця? Коли це все цифри, чи не "чоловічі" та "жіночі" є лише етикетками для зразків?
naught101

Відповіді:


13

Подумайте над своїм твердженням як про частого лікаря та спершу зробіть його більш конкретним. Часто лікар не може сказати, що "набір даних A відрізняється від набору даних B" без будь-яких додаткових роз'яснень.

По-перше, вам доведеться зазначити, що ви маєте на увазі під "різними". Можливо, ви маєте на увазі "мають різні середні значення". Знову ж таки, ви можете сказати, що "мають різні відхилення". А може, щось інше?

Тоді вам доведеться вказати, який саме тест ви б використовували, що залежить від того, які ви вважаєте, чи є правильними припущення щодо даних. Ви припускаєте, що набори даних обидва зазвичай розподіляються приблизно щодо певних засобів? Або ти вважаєш, що вони обидва бета-версії? Або щось інше?

Тепер ви бачите, що друге рішення дуже схоже на пріорі в баєсівській статистиці? Це не просто "мій минулий досвід", а швидше те, в що я вірю, і те, в що я вірю моїм ровесникам, є обґрунтованими припущеннями щодо моїх даних. (І баєси можуть використовувати однакові пріори, що підштовхує речі до частотних розрахунків.)

EDIT: У відповідь на ваш коментар: наступний крок міститься в першому згаданому нами рішенні. Якщо ви хочете вирішити, чи відрізняються засоби двох груп, ви подивитесь на розподіл різниці засобів двох груп, щоб побачити, чи цей розподіл містить чи не містить нуля, на якомусь рівні впевненості. Наскільки саме близький до нуля ви зараховуєте до нуля і яку саме частину (задньої) дистрибуції ви використовуєте, визначаєте ви та рівень впевненості, який ви бажаєте.

Обговорення цих ідей можна знайти у статті Крушке , який також написав дуже читану книгу " Проведення Байєсівського аналізу даних" , яка висвітлює приклад на сторінках 307-309 "Чи рівні групи?". (Друге видання: стор. 468-472.) Він також публікує блог на цю тему , з деякими запитаннями та питаннями.

ДОПОМОГА редакція: Ваш опис байєсівського процесу також не зовсім коректний. Байєсів цікавить лише те, що нам дають дані, зважаючи на те, що ми знали, незалежно від даних. (Як зазначає Крушке, попереднє значення не обов'язково відбувається перед даними. Саме з цього випливає ця фраза, але насправді це лише наші знання, виключаючи деякі дані.) Те, що ми знали незалежно від певного набору даних, може бути розпливчастим або конкретним. і може базуватися на консенсусі, моделі основного процесу генерування даних або можуть бути просто результатами іншого (не обов'язково попереднього) експерименту.


Так, гаразд, часто лікарі припускають розподіл, і це суб'єктивно. Але тоді вони можуть просто виміряти параметри кожного зразка з помилкою і сказати «нормально, це параметри справжньої сукупності кожного вибірки, і тепер яка ймовірність того, що різниця саме через помилку вибірки». Моє питання про крок після вашої відповіді - як зробити Байес відмінність між зразками Infer (давайте припустимо , що зразки з тих же типу розподілу, параметричного чи ні).
naught101

@ naught101: Перегляньте мою редакцію.
Уейн

@Wayne папір, яку ви зв'язали, є відмінною. Дякуємо за обмін
Cam.Davidson.Pilon

@ naught101: я оновив посилання на блог. Він, очевидно, зберігає старіші версії статті, і кожна посилання на новішу, а ту, до якої я вперше посилався, є три застарілі версії.
Уейн

Це досить класний метод, і він дійсно дає зрозуміти, як може працювати байєсівський висновок (трактуючи параметри розподілу як джерело невизначеності). Шкода, що це обчислювально інтенсивно. Також використання 95% CI здається занадто схожим на встановлення рівня значущості, але я не можу зрозуміти, чи існує реальний спосіб отримати звітний еквівалент p-значення (можливо, сума ймовірностей значень більше крайній, ніж 0 від середнього, для різниці в засобах?).
naught101

14

ця стаття може бути цікавою: http://arxiv.org/pdf/0906.4032v1.pdf

У ньому подано короткий підсумок деяких частістських та баєсовських підходів до двох вибіркових проблем, а також обговорюються як параметричні, так і непараметричні випадки.

Це може додати щось до інших відповідей, щоб дати простий приклад. Скажімо, у вас є два набори даних та де кожен та або або . Ви припускаєте ідентичну модель Бернуллі в обох випадках, тому коженxyxiyj01xiBern(p)yiBern(q)

H0:p=q

H1:p,q

Ймовірність отримання даних у кожному конкретному випадку є:

H0L0(p)=f(x,y;p)=ipi(1p)1ijpj(1p)1j

H1L1(p,q)=f(x,y;p,q)=ipi(1p)1ijqj(1q)1j

H0q=p

W=2log{L0(pmax)L1(pmax,qmax)},

pmax,qmaxpqpmaxpmaxWχ12H0

pπ0H0p,qπ1H1

BF=f(x,y|H0)f(x,y|H1)=01L0(p)π0(p)dp0101L1(p,q)π1(p,q)dpdq

H0H1H0H1 p(H0)=p(H1)=1/2

p(H0|x,y)p(H1|x,y)=BF×p(H0)p(H1)=BF×1/21/2=BF.

>1H0H1H0

H1

Сподіваюся, що це допомагає разом з іншими вже опублікованими відповідями.


0

З огляду на дані, наскільки сильно ми вважаємо, що 2 групи не походять з одного населення (H_1: вони не походять з одного населення проти H_0: вони походять з одного населення). Це можна зробити за допомогою байєсівського t-тесту.

Складність використовується для того, щоб визначити, наскільки попереднє перекривається однією гіпотезою. Fit використовується для того, щоб визначити, наскільки задня частина перекривається однією гіпотезою. У поєднанні ви можете порівняти гіпотези та висловити свою задню віру в те, чи походять вони з одного населення.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.