Взаємозв'язок між біноміальними та бета-розподілами


27

Я більше програміст, ніж статистик, тому сподіваюся, що це питання не надто наївне.

Це трапляється при вибірковому виконанні програм у випадкові часи. Якщо я беру N = 10 вибірки випадкового часу стану програми, я можу побачити, як функція Foo виконується, наприклад, I = 3 з цих вибірок. Мене цікавить, що це говорить мені про фактичну частку часу F, який Foo виконує.

Я розумію, що я біноміально розподілений із середнім F * N. Я також знаю, що, враховуючи I і N, F слід за бета-розподілом. Насправді я перевірив програмою зв’язок між цими двома дистрибутивами, який є

cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1

Проблема в тому, що я не маю інтуїтивного почуття щодо відносин. Я не можу "уявити", чому це працює.

РЕДАКТУВАННЯ: Усі відповіді були складними, особливо @ whuber's, який мені все-таки потрібно подбати, але приведення в порядок статистики було дуже корисним. Тим не менш я зрозумів, що мені слід було б задати більш основне питання: Враховуючи I і N, що таке розподіл для F? Усі вказали, що це Бета, яку я знав. Зрештою я зрозумів з Вікіпедії ( попередньо кон'югат ), що, здається, є Beta(I+1, N-I+1). Ознайомившись із програмою, вона виявляється правильною відповіддю. Отже, я хотів би дізнатися, чи не помиляюся. І я все ще плутаю стосунки між двома cdfs, показаними вище, чому вони дорівнюють 1, і якщо вони навіть мають щось спільне з тим, що я насправді хотів знати.


Якщо "те, що ви насправді хотіли знати", - це "фактична частка часу, яку Foo виконує", то ви запитуєте про довірчий інтервал двочленів або достовірний інтервал (байєсівський) двочлен.
whuber

@whuber: Добре, що я використовував метод налаштування продуктивності на випадкових паузах протягом 3-х десятиліть, і деякі інші люди його також виявили. Я говорив людям, що якщо якась умова є справжньою для двох або більше зразків випадкового часу, то її видалення дозволить заощадити добру частину часу. ЯК хороша частка - це те, про що я намагався бути явним, припускаючи, що ми не знаємо байєсівського попередника. Ось загальне полум'я: stackoverflow.com/questions/375913/… та stackoverflow.com/questions/1777556/alternatives-to-gprof/…
Майк Данлаве

1
Хороша ідея. Статистичне припущення полягає в тому, що переривання не залежить від стану виконання, що є розумною гіпотезою. Біном довірчий інтервал є хорошим інструментом для використання для подання невизначеності. (Це також може бути відкривачем очей: у вашій ситуації 3/10 симетричний двосторонній 95% ІС для справжньої ймовірності становить [6,7%, 65,2%]. У ситуації 2/10 інтервал становить [2,5 %, 55,6%]. Це широкі діапазони! Навіть при 2/3 нижня межа все ще менше 10%. Урок полягає в тому, що щось досить рідкісне може трапитися вдвічі.)
помах

@whuber: Дякую Ти правий. Щось більш корисне - очікуване значення. Що стосується пріорів, я зазначаю, що якщо ви бачите щось лише один раз, це не дуже розказує вам, якщо ви не знаєте, що програма знаходиться в нескінченному (або дуже довгому) циклі.
Майк Данлаве

Я думаю, що всі відповіді та коментарі, безумовно, були освічуючими та правильними, але ніхто не торкався цікавої рівності, яку @MikeDunlavey виклав у своєму первісному дописі. Цю рівність можна знайти на Beta wikipedia en.wikipedia.org/wiki/Beta_function#Incomplete_beta_function, але не описано, чому це так, його щойно зазначено як властивість.
bdeonovic

Відповіді:


27

Розглянемо статистику замовлень з незалежних малюнків з рівномірного розподілу. Оскільки статистика замовлень має бета-розподіли , шанс, що не перевищує , задається інтегралом Beta n + 1 x [ k ] px[0]x[1]x[n]n+1x[k]p

Pr[x[k]p]=1B(k+1,nk+1)0pxk(1x)nkdx.

(Чому це так? Ось не сувора, але пам'ятна демонстрація. Шанс, що лежить між і є ймовірність, що з рівномірних значень, з них лежить між і , принаймні один з них лежить між і , а решта лежить між та Для першого порядку в нескінченному нам потрібно розглянути лише випадок, коли саме одне значення (а саме сама) лежить між і і тому pp+dpn+1k0ppp+dpp+dp1dp x [ k ] pp+dpn-kp+dp p k (dp)(1-р-дп ) п - к дx[k]pp+dpn+1k0ppp+dpp+dp1dpx[k]pp+гpн-к значення перевищують . Оскільки всі значення незалежні та рівномірні, ця ймовірність пропорційна . Для першого порядку в це дорівнює , саме інтеграду розподілу Beta. Термін можна обчислити безпосередньо з цього аргументу як мультиноміальний коефіцієнт або покласти побічно як нормалізуюча константа інтеграла.)p+гppк(гp)(1-p-гp)н-кp k ( 1 - p ) n - k d p 1гppк(1-p)н-кгp1Б(к+1,н-к+1)(н+1к,1,н-к)

За визначенням, подія полягає в тому, що значення не перевищує . Що рівно, щонайменше значень не перевищує : це просте (і я сподіваюся очевидне) твердження забезпечує інтуїцію, яку ви шукаєте. Ймовірність еквівалентного твердження задається біноміальним розподілом,k + 1 st p k + 1 pх[к]pк+1вулp к+1p

Пр[принаймні к+1 з хip]=j=к+1н+1(н+1j)pj(1-p)н+1-j.

Підводячи підсумок , бета-інтеграл розбиває обчислення події на ряд обчислень: знаходження принаймні значень у діапазоні , імовірність якого ми зазвичай обчислимо з двочленним cdf, розбивається на взаємно виняткові випадки, коли саме значення знаходяться в діапазоні і 1 значення знаходиться в діапазоні для всіх можливих , , а - нескінченно мала довжина. Підсумовуючи всі такі "вікна" - тобто інтегруючи - потрібно дати таку ж ймовірність, що і біноміальний cdf.[ 0 , p ] k [ 0 , x ] [ x , x + d x ] x 0 x < p d x [ x , x + d x ]к+1[0,p] к[0,х][х,х+гх]х0х<pгх[х,х+гх]

alt текст


Я ціную зусилля. Мені доведеться по-справжньому вивчити це, бо це не моя "рідна мова". Також я бачу багато знаків долара та форматування матеріалів. Чи є щось, про що я не знаю, що робить це схожим на справжню математику?
Майк Данлаве

Що сталося? Раптом математика виявилася, і введення сюди стало справді повільним.
Майк Данлаве


Я переглянув питання, якщо ви хочете поглянути. Спасибі.
Майк Данлаве

1
Трохи пізно, але я нарешті встиг сісти і заново створити ваш аргумент. Ключовим був "мультиноміальний коефіцієнт". Я спробував розібратися в цьому, використовуючи звичайні старі двочленні коефіцієнти, і я все підготував. Ще раз дякую за гарну відповідь.
Майк Данлаве

12

Подивіться на pdf Binomial як на функцію : та pdf Beta як функцію : Напевно ви можете бачити що з відповідним (цілим) вибором для і вони однакові. Наскільки я можу сказати, у цьому відношенні все є: спосіб входить у двочленний pdf просто називається бета-розподілом.f ( x ) = ( nхpg(p)=Γ(a+b)

f(х)=(нх)pх(1-p)н-х
pabp
г(p)=Γ(а+б)Γ(а)Γ(б)pа-1(1-p)б-1
абp

Я знаю, що вони виглядають майже однаково, але якщо я підміняю y на nx, і якщо я беру Beta pdf і замінюю x на a-1 і y на b-1, я отримую додатковий коефіцієнт (x + y + 1), або n + 1. тобто (x + y + 1)! / x! / y! * p ^ x * q ^ y. Цього, здається, достатньо, щоб відкинути мене.
Майк Данлаве

1
Можливо, хтось задзвенить з повною реакцією, але в "інтуїтивному" поясненні ми завжди можемо відмовитись від постійних констант (наприклад, ), які не залежать від змінних, що цікавлять ( і ), але зобов'язані змусити pdf додати / інтегрувати до 1. Не соромтеся замінювати знаки "рівності" знаками "пропорційні". x pн+1хp
Аніко

Влучне зауваження. Я думаю, я наближаюся до розуміння. Я все ще намагаюся сказати, що х говорить вам про розподіл p, і чому ці два CDF дорівнюють 1.
Майк Данлаве

1
Я по-іншому сприймаю "інтуїтивні" пояснення. У деяких випадках ми не надто дбаємо про константи, але в цьому випадку суть справи полягає в тому, щоб зрозуміти, чому з'являється n + 1, а не n. Якщо ви цього не розумієте, то ваша "інтуїція" неправильна.
whuber

Я переглянув питання, якщо ви хочете поглянути. Спасибі.
Майк Данлаве

5

Як ви зазначали, бета-розподіл описує розподіл параметра пробної ймовірності , тоді як біноміальний розподіл описує розподіл параметра результату . Переписуючи своє запитання, про що ви питали, чому Тобто ймовірність того, що спостереження плюс одне більше, ніж очікування спостереження, така ж, як ймовірність того, що спостереження плюс один більше, ніж очікування спостереження.I P ( F i + 1ЖЯP(Fni+1)+P(I+1fn)=1P(Fni+1)=P(fn<I+1)

П(Жi+1н)+П(Яfн-1)=1
П(Жнi+1)+П(Я+1fн)=1
П(Жнi+1)=П(fн<Я+1)

Я визнаю, що це може не допомогти зрозуміти оригінальну постановку проблеми, але, можливо, це допоможе принаймні побачити, як два розподіли використовують одну і ту ж основну модель повторних випробувань Бернуллі для опису поведінки різних параметрів.


Я вдячний за те, що ти став на це. Усі відповіді допомагають мені подумати над питанням і, можливо, краще зрозуміти, що я прошу.
Майк Данлаве

Я переглянув питання, якщо ви хочете поглянути. Спасибі.
Майк Данлаве

1
Щодо перегляду: Так, , якщо ваші інтервали вибірки досить довгі, що кожне спостереження є незалежним та однаково розподіленим. Зауважте, що якщо ви хочете бути байєсівськими щодо цього і вказати неоднорідний попередній розподіл щодо того, на який ви очікуєте фактичну пропорцію, ви можете додати щось інше до обох параметрів. ЖБета(Я+1,N-Я+1)
ssqu

@sesqu, чи може ваша відповідь якимось чином пов’язана з моїм запитанням тут: stats.stackexchange.com/questions/147978/… ? Буду вдячний за ваші думки з цього приводу.
Vicent

1

На землі Байєса розподіл Beta є кон'югатом, що передує p параметру біноміального розподілу.


2
Так, але чому це так?
vonjd

1

Не можу коментувати інші відповіді, тому мені доведеться створити власну відповідь.

Posterior = C * Ймовірність * Prior (C - константа, що робить "Posterior" інтегрованою до 1)

Дана модель, яка використовує біноміальний розподіл для вірогідності, а бета-розподіл для Prior. Продукт двох, що генерує Posterior, також є бета-розподілом. Оскільки Prior і Posterior - це бета-версія, і тому вони є сполученими розподілами . пріоритет (бета-версією) називається кон'югатом, попереднім для імовірності (двочлен). Наприклад, якщо ви помножите бета-версію на нормальну, то Posterior вже не є бета-версією. Підсумовуючи, Бета та Біноміал - це два розподіли, які часто використовуються в байєсівському висновку. Бета - це кон'югатний пріоритет двочлена, але два розподіли не є підмножиною або надмножиною іншого.

Ключова ідея Байєсового висновку полягає в тому, що ми розглядаємо параметр p як випадкову величину, яка варіюється від [0,1], що суперечить частостістському підходу до висновку, коли ми розглядаємо параметр p як фіксований. Якщо ви уважно подивитеся на властивості розподілу бета-версії, ви побачите, що її середнє значення та режим визначаються виключно символами та не стосуються параметра pαβ . Це в поєднанні зі своєю гнучкістю є причиною того, що Beta зазвичай використовується як пріоритет.


1

Короткий зміст: Часто говорять, що бета-розподіл - це розподіл на дистрибутивах! Але що таке засоби?

Це по суті означає, що ви можете виправити і подумати як функцію . Наведений нижче розрахунок - це те, що значення збільшується від до коли ви налаштовуєте від до . Коефіцієнт, що збільшується на кожному є рівно на цьому .н,кП[Бiн(н,p)к]pП[Бiн(н,p)к]01p01pβ(к,н-к+1)p

введіть тут опис зображення


Нехай позначає біноміальну випадкову величину з вибірками та ймовірністю успіху . Використовуючи основну алгебру у насБiн(н,p)нp

ггpП[Бiн(н,p)=i]=н(П[Бiн(н-1,p)=i-1]-П[Бiн(н-1,p)=i]).

У нього також є хороший комбінаторний доказ, подумайте про це як про вправу!

Отже, у нас є:

ггpП[Бiн(н,p)к]=ггpi=кнП[Бiн(н,p)=i]=н(i=кнП[Бiн(н-1,p)=i-1]-П[Бiн(н-1,p)=i])
яка є телескопічною серією і може бути спрощена як

ггpП[Бiн(н,p)к]=нП[Бiн(н-1,p)=к-1]=н!(к-1)!(н-к)!pк-1(1-p)н-к=β(к,н-к+1).


Зауваження Щоб побачити інтерактивну версію сюжету, подивіться на це . Ви можете завантажити ноутбук або просто скористатися посиланням "Біндер".

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.