Розглянемо суму рівномірних розподілів на , або . Чому в PDF- зникає для ?


40

Я деякий час замислювався над цим; Я вважаю це трохи дивно, як це круто відбувається. В основному, навіщо нам просто три форми для щоб згладити, як це? І чому згладжування відбувається так відносно швидко?Zn

Z2 :

2

Z3 :

3

(зображення безсоромно викрадені з блогу Джона Д. Кука: http://www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/ )

Чому б не взяти, скажімо, чотири уніформи? Або п’ять? Або ...?


11
добре, щоб бути таким простим, як бути легким, тому що сума 3 обмундирування має квадратичні відрізки у своєму pf, і як тільки ви отримаєте дві або більше форми, у вас є пік середнього рівня. Квадратний пік "гладкий" ... і з'єднання між квадратичними фігурами знаходяться на 1 і 2, тому він не може зігнутися на 1,5; Є й інші способи дійти того ж висновку
Glen_b

Відповіді:


71

Ми можемо використовувати різні підходи до цього, будь-який з яких може здатися інтуїтивним для деяких людей і менш інтуїтивним для інших. Для задоволення такої варіації ця відповідь описує декілька таких підходів, що охоплюють основні підрозділи математичної думки - аналіз (нескінченне та нескінченно мале), геометрія / топологія (просторові відносини) та алгебра (формальні закономірності символічного маніпулювання) - а також сама ймовірність. Він завершився спостереженням, яке об'єднує всі чотири підходи, демонструє, що тут має бути відповідне справжнє питання, і точно показано, в чому полягає проблема. Кожен підхід забезпечує по-своєму глибше розуміння природи форм функцій розподілу ймовірності сум незалежних рівномірних змінних.


Фон

Рівномірний розподіл[0,1] має кілька основних описів. Коли має такий розподіл,X

  1. Шанс, що лежить у вимірюваному множині - це лише міра (довжина) , написана.A A [ 0 , 1 ] | A [ 0 , 1 ] |XAA[0,1]|A[0,1]|

  2. З цього випливає, що функція кумулятивного розподілу (CDF) є

    FX(x)=Pr(Xx)=|(,x][0,1]|=|[0,min(x,1)]|={0x<0x0x11x>1.

    CDF

  3. Функція щільності ймовірності (PDF), яка є похідною CDF, є для і іншому випадку. (Не визначено в і )fX(x)=10x1fX(x)=001

    PDF


Інтуїція з характерних функцій (аналіз)

Характеристична функція (КФ) будь випадкової величини є очікування (де це уявна одиниця, ). Використовуючи PDF рівномірного розподілу, ми можемо обчислитиXexp(itX)ii2=1

ϕX(t)=exp(itx)fX(x)dx=01exp(itx)dx=exp(itx)it|x=0x=1=exp(it)1it.

CF - це (версія) перетворення Фур'є у форматі PDF, . Найбільш основні теореми про перетворення Фур'є:ϕ(t)=f^(t)

  • CF суми незалежних змінних є добутком їх CF.X+Y

  • Коли вихідний PDF є безперервним і обмежений, може бути відновлений із CF за допомогою тісно пов'язаної версії перетворення Фур'є,fXfϕ

f(x)=ϕˇ(x)=12πexp(ixt)ϕ(t)dt.
  • Коли диференційоване, його похідну можна обчислити за цілісним знаком:f

    f(x)=ddx12πexp(ixt)ϕ(t)dt=i2πtexp(ixt)ϕ(t)dt.

    Щоб це було чітко визначено, останній інтеграл повинен абсолютно збігатися; це,

    |texp(ixt)ϕ(t)|dt=|t||ϕ(t)|dt

    повинні сходитися до кінцевого значення. І навпаки, коли вона конвергується, похідна існує скрізь завдяки цим формулам інверсії.

Тепер зрозуміло, наскільки точно відрізняється PDF за сумою рівномірних змінних: від першої кулі, CF суми iid змінних - це CF однієї з них, піднятий до потужності, тут дорівнює . Чисельник обмежений (складається з синусоїд), тоді як знаменник - . Ми можемо помножити такий інтеград на і він все одно буде абсолютно сходитися, коли і умовно сходиться, коли . Таким чином, багаторазове застосування третьої кулі показує, що PDF для суми рівномірних змінних буде постійноnnth(exp(it)1)n/(it)nO(tn)tss<n1s=n1nn2час диференційований і, в більшості місць, він буде разів диференційований.n1

CF для n = 10

Синя затінена крива - це лог-журнальний графік абсолютного значення реальної частини CF суми однорідних змінних. Пунктирна червона лінія - це асимптота; її нахил дорівнює , показуючи, що PDF - разів. Для довідки, сіра крива зображує реальну частину CF для аналогічної форми Гауссової функції (звичайний PDF).n=1010102=8


Інтуїція від ймовірності

Нехай і є незалежними випадковими змінними, де має рівномірний розподіл. Розглянемо вузький інтервал . Ми розкладаємо шанс того, що на ймовірність, що достатньо близький до цього інтервалу, більше, ніж шанс, що - просто потрібний розмір розмістити в цьому інтервалі, враховуючи, що досить близько:YXX[0,1](t,t+dt]X+Y(t,t+dt]YXX+YY

fX+Y(t)dt=Pr(X+Y(t,t+dt])=Pr(X+Y(t,t+dt]|Y(t1,t+dt])Pr(Y(t1,t+dt])=Pr(X(tY,tY+dt]|Y(t1,t+dt])(FY(t+dt)FY(t1))=1dt(FY(t+dt)FY(t1)).

Остаточне рівність приходить з виразу для прва . Ділення обох сторін на та прийняття межі як даєXdtdt0

fX+Y(t)=FY(t)FY(t1).

Іншими словами, додавання Уніфікованої змінної до будь-якої змінної змінює pdf на різницю CDF . Оскільки PDF є похідною CDF, це означає, що кожного разу, коли ми додаємо незалежну рівномірну змінну , отриманий PDF є в один раз більш диференційованим, ніж раніше.[0,1]XYfYFY(t)FY(t1)Y

Давайте застосуємо це розуміння, починаючи з єдиної змінної . Оригінальний PDF не може бути диференційований у або : він там припиняється. У форматі PDF з НЕ дифференцируема в точці , або , але вона повинна бути неперервна в тих точках, тому що це різниця інтегралів PDF з . Додайте ще одну незалежну рівномірну змінну : PDF можна диференціювати на , , і - але це не обов'язково має другийY01Y+X012YX2Y+X+X2 0123похідні в цих точках. І так далі.


Інтуїція з геометрії

CDF при суми однорідних змінних дорівнює об єму одиничної гіперкуби лежить у півпросторі . Тут показана ситуація для змінних, при цьому встановлюється на , , а потім на .tn[0,1]nx1+x2++xntn=3t1/23/25/2

3D куб

У міру прогресування від до гіперплана перетинає вершини при , . З кожним разом змінюється форма перерізу: на рисунку спочатку це трикутник ( -простий), потім шестикутник, потім знову трикутник. Чому PDF не має різких вигинів при цих значеннях ?t0nHn(t):x1+x2++xn=tt=0t=1,,t=n2t

Щоб зрозуміти це, спочатку розглянемо невеликі значення . Тут гіперплан відсікає -простий. Всі розміри симплекса прямо пропорційні , звідки його "площа" пропорційна . Деякі позначення для цього стануть у нагоді пізніше. Нехай є "функцією одиничного кроку".tHn(t)n1n1ttn1θ

θ(x)={0x<01x0.

Якби не наявність інших куточків гіперкуба, це масштабування тривало б нескінченно. Діаграма площі -простого виглядала б як суцільна синя крива внизу: вона дорівнює нулю при від'ємних значеннях і дорівнюєпри позитивному, зручно написаному. Він має "перегин" порядку за початком, в тому сенсі, що всі похідні через порядок існують і є безперервними, але ліві та праві похідні порядку існують, але не погоджуються при походженні .n1tn1/(n1)!θ(t)tn1/(n1)!n2n3n2

(Інші криві, показані на цьому малюнку, - (Червоний), (Золото) і (Чорний). Їх ролі у випадку обговорюються далі нижче.)3θ(t1)(t1)2/2!3θ(t2)(t2)2/2!θ(t3)(t3)2/2!n=3

Проста ділянка ділянки

Щоб зрозуміти, що відбувається, коли перетинає , розглянемо детально випадок , де вся геометрія відбувається в площині. Ми можемо розглядати одиницю "куба" (тепер просто квадрат) як лінійну комбінацію квадрантів , як показано тут:t1n=2

Квадранти

Перший квадрант з’являється в нижній лівій панелі, сірим кольором. Значення дорівнює , визначаючи діагональну лінію, показану на всіх п’яти панелях. CDF дорівнює жовтої області, зображеній справа. Ця жовта зона складається з:t1.5

  1. Трикутна сіра зона в нижній лівій панелі,

  2. мінус трикутна зелена зона у верхній лівій панелі,

  3. мінус трикутна червона зона в нижній середній панелі,

  4. плюс будь-яка синя область у верхній середній панелі (але немає такої області, і не буде, поки перевищить ).t2

Кожна з цих областей - це область трикутника. Перша шкала на зразок , наступні два дорівнюють нулю для а в іншому випадку масштабується як , а остання дорівнює нулю для і в іншому випадку масштабує . Цей геометричний аналіз встановив, що CDF пропорційний = ; еквівалентно, що PDF пропорційний сумі трьох функцій , і2n=4tn=t2t<1(t1)n=(t1)2t<2(t2)nθ(t)t2θ(t1)(t1)2θ(t1)(t1)2+θ(t2)(t2)2θ(t)t22θ(t1)(t1)2+θ(t2)(t2)2θ(t)t2θ(t1)(t1)θ(t2)(t2)(кожен з них масштабується лінійно, коли ). На лівій панелі цього малюнка показані їхні графіки: очевидно, що вони всі версії оригінального графіка , але (a) зміщені на , і одиниці вправо і (b) змінено на , та відповідно.n=2θ(t)t012121

Графіки для n = 2

Права панель показує суму цих графіків (суцільна чорна крива, нормалізована для одиниці площі: це саме кутовий PDF, показаний в оригінальному запитанні.

Тепер ми можемо зрозуміти природу "перегинів" у PDF будь-якої суми однорідних змінних iid. Вони всі точно так само, як "перегин", який виникає при у функції , можливо, змінити масштаб і переміститися на цілі числа відповідні місцевості гіперплана перетинає вершини гіперкуба. Для це видима зміна напрямку: права похідна при дорівнює а ліва похідна - . Для це безперервна0θ(t)tn11,2,,nHn(t)n=2θ(t)t001n=3зміна напрямку, але раптова (переривчаста) зміна другої похідної. Для загального будуть похідні похідні через порядок але розрив у похідній .nn2n1st


Інтуїція з алгебраїчної маніпуляції

Інтеграція для обчислення КФ, форма умовної ймовірності в імовірнісному аналізі та синтез гіперкуба як лінійної комбінації квадрантів все це дозволяє повернутися до початкового рівномірного розподілу та повторно виразити його як лінійну комбінацію більш простих речей . Дійсно, його PDF можна написати

fX(x)=θ(x)θ(x1).

Введемо оператор зсуву : він діє на будь-яку функцію , переміщуючи свій графік на одну одиницю праворуч:Δf

(Δf)(x)=f(x1).

Офіційно тоді для PDF єдиної змінної ми можемо написатиX

fX=(1Δ)θ.

PDF суми iid мундирів - це згортання із самим разів. Це випливає з визначення суми випадкових величин: згортка двох функцій і є функцієюnfXnfg

(fg)(x)=f(xy)g(y)dy.

Неважко перевірити, що згортання змінюється з . Просто змініть змінну інтеграції з на :Δyy+1

(f(Δg))=f(xy)(Δg)(y)dy=f(xy)g(y1)dy=f((x1)y)g(y)dy=(Δ(fg))(x).

Для PDF-файлу суми iid мундирів ми можемо продовжити алгебраїчно писатиn

f=fXn=((1Δ)θ)n=(1Δ)nθn

(де "потужність" позначає повторну згортку, а не точкове множення!). Тепер - це пряма, елементарна інтеграція, що даєnθn

θn(x)=θ(x)xn1n1!.

Решта - алгебра, оскільки застосовується біноміальна теорема (як це стосується будь-якої комутативної алгебри над реалами):

f=(1Δ)nθn=i=0n(1)i(ni)Δiθn.

Оскільки просто зміщує свій аргумент на , це демонструє PDF як лінійну комбінацію зміщених версій , точно так, як ми вивели геометрично:Δiifθ(x)xn1

f(x)=1(n1)!i=0n(1)i(ni)(xi)n1θ(xi).

(Джон Кук цитує цю формулу пізніше у своєму дописі в блозі, використовуючи позначення for .)(xi)+n1(xi)n1θ(xi)

Відповідно, оскільки - це гладка функція скрізь, будь-яка особлива поведінка PDF відбуватиметься лише в тих місцях, де є сингулярним (очевидно, всього ), і в тих місцях, які зміщені праворуч на . Характер такої особливості поведінки - ступінь гладкості - тому буде однаковим у всіх місцях.xn1θ(x)01,2,,nn+1

Ілюструючи це малюнком для , що показує (на панелі ліворуч) окремі доданки в сумі і (на правій панелі) часткові суми, що досягають самої суми (суцільна чорна крива):n=8

Сюжет при n = 8


Заключні коментарі

Корисно зауважити, що цей останній підхід нарешті дав компактний, практичний вираз для обчислення PDF сумою ятих рівномірних змінних. (Аналогічно отримана формула CDF.)n

Теорема про центральну межу тут мало сказати. Зрештою, сума iid біноміальних змінних сходиться до нормального розподілу, але ця сума завжди дискретна: вона ніколи навіть не має PDF! Ми не повинні сподіватися, що будь-яка інтуїція щодо "перегинів" чи інших заходів диференційованості PDF-файлу походить від CLT.


12
(+1) Фантастично! Тепер, скільки часу вам знадобилося, щоб ви все це зібрали ?!
кардинал

13
@Cardinal Це було останнє питання, яке я прочитав перед тим, як втратити владу минулого понеділка. Протягом наступного тижня довгі темні вечори давали можливість продумати це через :-) і для розваги розробити кілька відповідей. Після того, як влада була відновлена ​​минулих вихідних, було лише питання знайти час, щоб зробити ілюстрації та написати все (що, як я вважаю, зайняло більше часу, ніж очікувалося). Я сподіваюсь, що, можливо, частина цього потоку може послужити посиланням на відповідні майбутні питання щодо сум випадкових змінних.
whuber

1
Ого. Я б хотів, щоб я міг «улюбити» цю відповідь .
Ревінь

2
Бубер, це абсолютно дивовижно. Я ніколи не усвідомлював, наскільки глибоким може бути таке просте запитання. Мені знадобиться певний час, щоб детально відповісти, але поки що дуже дякую!
тетраграмматон

6
Я буду порушувати політику SE щодо коментарів, кажучи, що ми (всі crossvalidate.com) повинні підкупити вашу енергетичну компанію частіше відключати владу :)
mpiktas

1

Ви можете стверджувати, що функція щільності ймовірності рівномірної випадкової величини є кінцевою,

тому його інтегральна функція кумулятивної щільності рівномірної випадкової величини є безперервною,

тому функція щільності ймовірності суми двох рівномірних випадкових величин є безперервною,

тому його інтегральна функція кумулятивної щільності суми двох рівномірних випадкових величин є гладкою (постійно диференціюється),

тому функція щільності ймовірності суми трьох рівномірних випадкових величин є гладкою.


1

Я думаю, що більш дивно, що ви отримуєте різкий пік при . n=2

Центральна гранична теорема говорить, що для досить великих розмірів вибірки розподіл середнього значення (а сума - це лише середні часи , фіксована константа для кожного графіка) буде приблизно нормальним. Виявляється, рівномірний розподіл справді добре поводиться відносно CLT (симетричний, відсутні важкі хвости (ну не дуже багато хвостів), немає можливості випадати), тому для рівномірного розміру вибірки потрібно бути "досить великим "не дуже велика (близько 5 або 6 для гарного наближення), ви вже бачите наближення ОК при .nn=3

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.