Ми можемо використовувати різні підходи до цього, будь-який з яких може здатися інтуїтивним для деяких людей і менш інтуїтивним для інших. Для задоволення такої варіації ця відповідь описує декілька таких підходів, що охоплюють основні підрозділи математичної думки - аналіз (нескінченне та нескінченно мале), геометрія / топологія (просторові відносини) та алгебра (формальні закономірності символічного маніпулювання) - а також сама ймовірність. Він завершився спостереженням, яке об'єднує всі чотири підходи, демонструє, що тут має бути відповідне справжнє питання, і точно показано, в чому полягає проблема. Кожен підхід забезпечує по-своєму глибше розуміння природи форм функцій розподілу ймовірності сум незалежних рівномірних змінних.
Фон
Рівномірний розподіл[0,1] має кілька основних описів. Коли має такий розподіл,X
Шанс, що лежить у вимірюваному множині - це лише міра (довжина) , написана.A A ∩ [ 0 , 1 ] | A ∩ [ 0 , 1 ] |XAA∩[0,1]|A∩[0,1]|
З цього випливає, що функція кумулятивного розподілу (CDF) є
FX(x)=Pr(X≤x)=|(−∞,x]∩[0,1]|=|[0,min(x,1)]|=⎧⎩⎨⎪⎪0x1x<00≤x≤1x>1.
Функція щільності ймовірності (PDF), яка є похідною CDF, є для і іншому випадку. (Не визначено в і )fX(x)=10≤x≤1fX(x)=001
Інтуїція з характерних функцій (аналіз)
Характеристична функція (КФ) будь випадкової величини є очікування (де це уявна одиниця, ). Використовуючи PDF рівномірного розподілу, ми можемо обчислитиXexp(itX)ii2=−1
ϕX(t)=∫∞−∞exp(itx)fX(x)dx=∫10exp(itx)dx=exp(itx)it∣∣∣x=1x=0=exp(it)−1it.
CF - це (версія) перетворення Фур'є у форматі PDF, . Найбільш основні теореми про перетворення Фур'є:ϕ(t)=f^(t)
CF суми незалежних змінних є добутком їх CF.X+Y
Коли вихідний PDF є безперервним і обмежений, може бути відновлений із CF за допомогою тісно пов'язаної версії перетворення Фур'є,fXfϕ
f(x)=ϕˇ(x)=12π∫∞−∞exp(−ixt)ϕ(t)dt.
Коли диференційоване, його похідну можна обчислити за цілісним знаком:f
f′(x)=ddx12π∫∞−∞exp(−ixt)ϕ(t)dt=−i2π∫∞−∞texp(−ixt)ϕ(t)dt.
Щоб це було чітко визначено, останній інтеграл повинен абсолютно збігатися; це,
∫∞−∞|texp(−ixt)ϕ(t)|dt=∫∞−∞|t||ϕ(t)|dt
повинні сходитися до кінцевого значення. І навпаки, коли вона конвергується, похідна існує скрізь завдяки цим формулам інверсії.
Тепер зрозуміло, наскільки точно відрізняється PDF за сумою рівномірних змінних: від першої кулі, CF суми iid змінних - це CF однієї з них, піднятий до потужності, тут дорівнює . Чисельник обмежений (складається з синусоїд), тоді як знаменник - . Ми можемо помножити такий інтеград на і він все одно буде абсолютно сходитися, коли і умовно сходиться, коли . Таким чином, багаторазове застосування третьої кулі показує, що PDF для суми рівномірних змінних буде постійноnnth(exp(it)−1)n/(it)nO(tn)tss<n−1s=n−1nn−2час диференційований і, в більшості місць, він буде разів диференційований.n−1
Синя затінена крива - це лог-журнальний графік абсолютного значення реальної частини CF суми однорідних змінних. Пунктирна червона лінія - це асимптота; її нахил дорівнює , показуючи, що PDF - разів. Для довідки, сіра крива зображує реальну частину CF для аналогічної форми Гауссової функції (звичайний PDF).n=10−1010−2=8
Інтуїція від ймовірності
Нехай і є незалежними випадковими змінними, де має рівномірний розподіл. Розглянемо вузький інтервал . Ми розкладаємо шанс того, що на ймовірність, що достатньо близький до цього інтервалу, більше, ніж шанс, що - просто потрібний розмір розмістити в цьому інтервалі, враховуючи, що досить близько:YXX[0,1](t,t+dt]X+Y∈(t,t+dt]YXX+YY
fX+Y(t)dt=Pr(X+Y∈(t,t+dt])=Pr(X+Y∈(t,t+dt]|Y∈(t−1,t+dt])Pr(Y∈(t−1,t+dt])=Pr(X∈(t−Y,t−Y+dt]|Y∈(t−1,t+dt])(FY(t+dt)−FY(t−1))=1dt(FY(t+dt)−FY(t−1)).
Остаточне рівність приходить з виразу для прва . Ділення обох сторін на та прийняття межі як даєXdtdt→0
fX+Y(t)=FY(t)−FY(t−1).
Іншими словами, додавання Уніфікованої змінної до будь-якої змінної змінює pdf на різницю CDF . Оскільки PDF є похідною CDF, це означає, що кожного разу, коли ми додаємо незалежну рівномірну змінну , отриманий PDF є в один раз більш диференційованим, ніж раніше.[0,1]XYfYFY(t)−FY(t−1)Y
Давайте застосуємо це розуміння, починаючи з єдиної змінної . Оригінальний PDF не може бути диференційований у або : він там припиняється. У форматі PDF з НЕ дифференцируема в точці , або , але вона повинна бути неперервна в тих точках, тому що це різниця інтегралів PDF з . Додайте ще одну незалежну рівномірну змінну : PDF можна диференціювати на , , і - але це не обов'язково має другийY01Y+X012YX2Y+X+X2 0123похідні в цих точках. І так далі.
Інтуїція з геометрії
CDF при суми однорідних змінних дорівнює об єму одиничної гіперкуби лежить у півпросторі . Тут показана ситуація для змінних, при цьому встановлюється на , , а потім на .tn[0,1]nx1+x2+⋯+xn≤tn=3t1/23/25/2
У міру прогресування від до гіперплана перетинає вершини при , . З кожним разом змінюється форма перерізу: на рисунку спочатку це трикутник ( -простий), потім шестикутник, потім знову трикутник. Чому PDF не має різких вигинів при цих значеннях ?t0nHn(t):x1+x2+⋯+xn=tt=0t=1,…,t=n2t
Щоб зрозуміти це, спочатку розглянемо невеликі значення . Тут гіперплан відсікає -простий. Всі розміри симплекса прямо пропорційні , звідки його "площа" пропорційна . Деякі позначення для цього стануть у нагоді пізніше. Нехай є "функцією одиничного кроку".tHn(t)n−1n−1ttn−1θ
θ(x)={01x<0x≥0.
Якби не наявність інших куточків гіперкуба, це масштабування тривало б нескінченно. Діаграма площі -простого виглядала б як суцільна синя крива внизу: вона дорівнює нулю при від'ємних значеннях і дорівнюєпри позитивному, зручно написаному. Він має "перегин" порядку за початком, в тому сенсі, що всі похідні через порядок існують і є безперервними, але ліві та праві похідні порядку існують, але не погоджуються при походженні .n−1tn−1/(n−1)!θ(t)tn−1/(n−1)!n−2n−3n−2
(Інші криві, показані на цьому малюнку, - (Червоний), (Золото) і (Чорний). Їх ролі у випадку обговорюються далі нижче.)−3θ(t−1)(t−1)2/2!3θ(t−2)(t−2)2/2!−θ(t−3)(t−3)2/2!n=3
Щоб зрозуміти, що відбувається, коли перетинає , розглянемо детально випадок , де вся геометрія відбувається в площині. Ми можемо розглядати одиницю "куба" (тепер просто квадрат) як лінійну комбінацію квадрантів , як показано тут:t1n=2
Перший квадрант з’являється в нижній лівій панелі, сірим кольором. Значення дорівнює , визначаючи діагональну лінію, показану на всіх п’яти панелях. CDF дорівнює жовтої області, зображеній справа. Ця жовта зона складається з:t1.5
Трикутна сіра зона в нижній лівій панелі,
мінус трикутна зелена зона у верхній лівій панелі,
мінус трикутна червона зона в нижній середній панелі,
плюс будь-яка синя область у верхній середній панелі (але немає такої області, і не буде, поки перевищить ).t2
Кожна з цих областей - це область трикутника. Перша шкала на зразок , наступні два дорівнюють нулю для а в іншому випадку масштабується як , а остання дорівнює нулю для і в іншому випадку масштабує . Цей геометричний аналіз встановив, що CDF пропорційний = ; еквівалентно, що PDF пропорційний сумі трьох функцій , і2n=4tn=t2t<1(t−1)n=(t−1)2t<2(t−2)nθ(t)t2−θ(t−1)(t−1)2−θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t2−2θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t−2θ(t−1)(t−1)θ(t−2)(t−2)(кожен з них масштабується лінійно, коли ). На лівій панелі цього малюнка показані їхні графіки: очевидно, що вони всі версії оригінального графіка , але (a) зміщені на , і одиниці вправо і (b) змінено на , та відповідно.n=2θ(t)t0121−21
Права панель показує суму цих графіків (суцільна чорна крива, нормалізована для одиниці площі: це саме кутовий PDF, показаний в оригінальному запитанні.
Тепер ми можемо зрозуміти природу "перегинів" у PDF будь-якої суми однорідних змінних iid. Вони всі точно так само, як "перегин", який виникає при у функції , можливо, змінити масштаб і переміститися на цілі числа відповідні місцевості гіперплана перетинає вершини гіперкуба. Для це видима зміна напрямку: права похідна при дорівнює а ліва похідна - . Для це безперервна0θ(t)tn−11,2,…,nHn(t)n=2θ(t)t001n=3зміна напрямку, але раптова (переривчаста) зміна другої похідної. Для загального будуть похідні похідні через порядок але розрив у похідній .nn−2n−1st
Інтуїція з алгебраїчної маніпуляції
Інтеграція для обчислення КФ, форма умовної ймовірності в імовірнісному аналізі та синтез гіперкуба як лінійної комбінації квадрантів все це дозволяє повернутися до початкового рівномірного розподілу та повторно виразити його як лінійну комбінацію більш простих речей . Дійсно, його PDF можна написати
fX(x)=θ(x)−θ(x−1).
Введемо оператор зсуву : він діє на будь-яку функцію , переміщуючи свій графік на одну одиницю праворуч:Δf
(Δf)(x)=f(x−1).
Офіційно тоді для PDF єдиної змінної ми можемо написатиX
fX=(1−Δ)θ.
PDF суми iid мундирів - це згортання із самим разів. Це випливає з визначення суми випадкових величин: згортка двох функцій і є функцієюnfXnfg
(f⋆g)(x)=∫∞−∞f(x−y)g(y)dy.
Неважко перевірити, що згортання змінюється з . Просто змініть змінну інтеграції з на :Δyy+1
(f⋆(Δg))=∫∞−∞f(x−y)(Δg)(y)dy=∫∞−∞f(x−y)g(y−1)dy=∫∞−∞f((x−1)−y)g(y)dy=(Δ(f⋆g))(x).
Для PDF-файлу суми iid мундирів ми можемо продовжити алгебраїчно писатиn
f=f⋆nX=((1−Δ)θ)⋆n=(1−Δ)nθ⋆n
(де "потужність" позначає повторну згортку, а не точкове множення!). Тепер - це пряма, елементарна інтеграція, що дає⋆nθ⋆n
θ⋆n(x)=θ(x)xn−1n−1!.
Решта - алгебра, оскільки застосовується біноміальна теорема (як це стосується будь-якої комутативної алгебри над реалами):
f=(1−Δ)nθ⋆n=∑i=0n(−1)i(ni)Δiθ⋆n.
Оскільки просто зміщує свій аргумент на , це демонструє PDF як лінійну комбінацію зміщених версій , точно так, як ми вивели геометрично:Δiifθ(x)xn−1
f(x)=1(n−1)!∑i=0n(−1)i(ni)(x−i)n−1θ(x−i).
(Джон Кук цитує цю формулу пізніше у своєму дописі в блозі, використовуючи позначення for .)(x−i)n−1+(x−i)n−1θ(x−i)
Відповідно, оскільки - це гладка функція скрізь, будь-яка особлива поведінка PDF відбуватиметься лише в тих місцях, де є сингулярним (очевидно, всього ), і в тих місцях, які зміщені праворуч на . Характер такої особливості поведінки - ступінь гладкості - тому буде однаковим у всіх місцях.xn−1θ(x)01,2,…,nn+1
Ілюструючи це малюнком для , що показує (на панелі ліворуч) окремі доданки в сумі і (на правій панелі) часткові суми, що досягають самої суми (суцільна чорна крива):n=8
Заключні коментарі
Корисно зауважити, що цей останній підхід нарешті дав компактний, практичний вираз для обчислення PDF сумою ятих рівномірних змінних. (Аналогічно отримана формула CDF.)n
Теорема про центральну межу тут мало сказати. Зрештою, сума iid біноміальних змінних сходиться до нормального розподілу, але ця сума завжди дискретна: вона ніколи навіть не має PDF! Ми не повинні сподіватися, що будь-яка інтуїція щодо "перегинів" чи інших заходів диференційованості PDF-файлу походить від CLT.