Зв'язок між гамма-розподілом і нормальним розподілом


26

Нещодавно я вважав за необхідне отримати pdf для квадрата нормальної випадкової величини із середнім значенням 0. З будь-якої причини я вирішив не нормалізувати дисперсію заздалегідь. Якщо я це зробив правильно, то цей pdf такий:

N2(x;σ2)=1σ2πxex2σ2

Я помітив, що насправді це була лише параметризація розподілу гами:

N2(x;σ2)=Gamma(x;12,2σ2)

І тоді, з того, що сума двох гам (з тим самим параметром масштабу) дорівнює іншій гамі, випливає, що гама еквівалентна сумі k квадратних нормальних випадкових величин.

NΣ2(x;k,σ2)=Gamma(x;k2,2σ2)

Це мене трохи здивувало. Хоча я знав, що розподіл χ2 - розподіл суми квадратних стандартних нормальних РВ - був особливим випадком гамми, я не розумів, що гамма є по суті лише узагальненням, що дозволяє отримати суму нормальних випадкових величин з будь-якої дисперсії. Це також призводить до інших характеристик, з якими я раніше не стикався, наприклад, експоненціального розподілу, еквівалентного сумі двох квадратних нормальних розподілів.

Це все для мене трохи загадково. Чи нормальне розподіл є основним для виведення гамма-розподілу, як я описав вище? Більшість ресурсів, які я перевірив, не згадують про те, що два дистрибутиви суттєво пов'язані між собою, або навіть з цього приводу описують, як виводиться гамма. Це змушує мене думати, що в грі є якась істина нижчого рівня, яку я просто підкреслив перекрученим шляхом?


6
У багатьох підручниках з теорії ймовірностей згадуються всі вищезазначені результати; але, можливо, тексти статистики не висвітлюють ці ідеї? У будь-якому випадку, N(0,σ2) випадкова величина Yi - просто де - це звичайна нормальна випадкова величина, і так (для iid змінних)X iσXiXi є простомасштабним χ 2iYi2=σ2iXi2 χ2випадкова величина не дивно для тих, хто вивчав теорію ймовірностей.
Діліп Сарват

Я з комп'ютерного зору, тому зазвичай не стикаюся з теорією ймовірностей. Жоден з моїх підручників (або Вікіпедії) не згадує про таке тлумачення. Я думаю, я також запитую, що особливого в сумі квадрата двох нормальних розподілів, що робить його гарною моделлю для часу очікування (тобто експоненціального розподілу). Досі відчувається, що я пропускаю щось глибше.
timxyz

3
Оскільки Вікіпедія визначає розподіл у квадраті в якості суми квадратних нормалів на en.wikipedia.org/wiki/Chi-squared_distribution#Definition і згадує, що чі-квадрат є особливим випадком Гамми (за адресою en.wikipedia.org/wiki / Gamma_distribution # Інші ), навряд чи можна стверджувати, що ці відносини не відомі. Сама дисперсія просто встановлює одиницю вимірювання (параметр шкали) у всіх випадках і тому взагалі не створює додаткових ускладнень.
whuber

3
Хоча ці результати добре відомі в області вірогідності та статистики, вам добре зроблено @timxyz для їх повторного виявлення у власному аналізі.
Відновіть Моніку

Зв'язок не є таємничим, тому що вони є членами експоненціальної сімейства розподілів, чіткою властивістю якої є те, що до них можна дійти шляхом заміни змінних та / або параметрів. Дивіться довшу відповідь нижче із прикладами.
Карл

Відповіді:


18

Як зазначається в коментарі проф. Сарват, відносини між нормальним квадратом і квадратом є дуже поширеним фактом - як це має бути також і факт, що квадрат квадратів є лише особливим випадком розподілу Гамми:

XN(0,σ2)X2/σ2χ12X2σ2χ12=Gamma(12,2σ2)

остання рівність, що випливає із властивості масштабування Гамми.

Що стосується співвідношення з експоненціалом, якщо бути точним, то сума двох квадратних нульових середніх норм, кожна з яких зменшується на дисперсію інших , призводить до експоненціального розподілу:

X1N(0,σ12),X2N(0,σ22)X12σ12+X22σ22χ22σ22X12+σ12X22σ12σ22χ22

σ22X12+σ12X22σ12σ22χ22=Gamma(1,2σ12σ22)=Exp(12σ12σ22)

Але підозра на те, що в сумі двох квадратних нульових середніх норм є "щось особливе" або "глибше", що "робить їх гарною моделлю для очікування часу", необгрунтоване: Перш за все, що особливого в експоненціальному розподілі це гарна модель для "часу очікування"? Безпам’ятність, звичайно, але чи є тут щось «глибше», чи просто проста функціональна форма функції Експоненціального розподілу та властивості ? Унікальні властивості розкидані по всій математиці, і більшу частину часу вони не відображають якоїсь "глибшої інтуїції" чи "структури" - вони просто існують (на щастя).e

По-друге, квадрат змінної має дуже мало відношення до її рівня. Просто розглянемо у, скажімо, [ - 2 ,f(x)=x :[2,2]

введіть тут опис зображення

... або накресліть стандартну нормальну щільність проти щільності квадрат-чі: вони відображають та представляють абсолютно різні стохастичні форми поведінки, навіть якщо вони настільки споріднені, оскільки друга - це щільність змінної, яка є квадратом першої. Нормальний може бути дуже важливим стовпом математичної системи, яку ми розробили для моделювання стохастичної поведінки - але, як тільки ви її квадратні, це стає чимось зовсім іншим.


Дякую за те, що я вирішила, зокрема, питання з мого останнього абзацу.
timxyz

2
Ласкаво просимо. Я маю визнати, що радий, що моя відповідь надійшла до початкової ОП через 26 місяців після опублікування запитання.
Алекос Пападопулос

11

Звернімося до поставленого питання: Це все для мене дещо загадкове. Чи нормальне розподіл є основним для виведення гамма-розподілу ...? Справді немає загадок, це просто те, що нормальний розподіл і гамма-розподіл є членами, серед інших, експоненціального сімейства розподілів, сімейство яких визначається здатністю перетворювати між рівняльними формами шляхом заміни параметрів та / або змінних. Як наслідок, існує багато перетворень за допомогою підстановки між розподілами, кілька з яких узагальнені на малюнку нижче.

введіть тут опис зображенняLEEMIS, Лоуренс М.; Жаклін Т. МККВЕСТОН (лютий 2008 р.). "Універсальні відносини розподілу" (PDF). Американський статистик. 62 (1): 45–53. DOI: 10,1198 / 000313008x270448 процитувати

Ось два нормальних та розподілу гамма-розподілу більш детально (серед невідомої кількості інших, наприклад, через чі-квадрат і бета).

По-перше, наступний Більш прямий зв’язок між розподілом гамма (GD) і нормальним розподілом (ND) із середнім нулем. Простіше кажучи, GD набуває нормальної форми, оскільки його параметр форми дозволено збільшувати. Довести, що це так, складніше. Для GD

GD(z;a,b)={baza1ezbΓ(a)z>00other.

Оскільки параметр форми GD , форма GD стає більш симетричною і нормальною, однак, оскільки середнє значення збільшується зі збільшенням a , ми повинні зсунути GD на ( a - 1 ) aaщоб утримувати його нерухомим, і, нарешті, якщо ми хочемо зберегти те саме стандартне відхилення для нашої зміщеної GD, ми повинні зменшити параметр шкали (b), пропорційний(a1)1akb .1a

Для того, щоб перетворити GD в граничний випадок ND, встановимо, що стандартне відхилення буде постійним ( ), дозволяючи b = kі змістити GD вліво, щоб мати режим нуля, замінившиz=(a-1)b=1akТоді GD ( ( a - 1 ) z=(a1)1ak+x .

GD((a1)1ak+x; a, 1ak)={(ka)aeaxka+1((a1)ka+x)a1Γ(a)x>k(1a)a0other.

Слід зазначити , що в межі найбільш від'ємного значення х , для яких ця Г.Д. відмінна від нуля -ax . Тобто, напівнескінченної підтримка GDстаєнескінченною. Переходячи до межі при з reparameterized GD, ми знаходимоa

lima(ka)aeaxka+1((a1)ka+x)a1Γ(a)=ex22k22πk=ND(x;0,k2)

k=2a=1,2,4,8,16,32,64ND(x;0, 22)

введіть тут опис зображення

По-друге, Зазначимо, що завдяки подібності форми між цими розподілами можна значно розвинути зв’язки між гаммою та нормальними розподілами, витягнувши їх з повітря. На думку, далі ми розробляємо «розгорнуте» узагальнення гамма-розподілу нормального розподілу.

Спершу зауважимо, що саме напівскінченна підтримка розподілу гамма перешкоджає більш прямому зв’язку з нормальним розподілом. Однак ця перешкода може бути усунена, якщо врахувати напів нормальний розподіл, який також має напівнескінченну підтримку. Таким чином, можна узагальнити нормальний розподіл (ND), спершу склавши його на половину нормального (HND), пов'язуючи це з узагальненим розподілом гамми (GD), потім для нашої тур-сили ми «розгортаємо» обидва (HND і GD), таким чином, зробити узагальнений ND (GND).

Узагальнений розподіл гамми

GD(x;α,β,γ,μ)={γe(xμβ)γ(xμβ)αγ1βΓ(α)x>μ0other,

Може бути перемежований таким чином, щоб він був напів нормальним ,

GD(x;12,πθ,2,0)={2θeθ2x2ππx>00other=HND(x;θ)

θ=πσ2.

ND(x;0,σ2)=12HND(x;θ)+12HND(x;θ)=12GD(x;12,πθ,2,0)+12GD(x;12,πθ,2,0),

з чого випливає це

GND(x;μ,α,β)=12GD(x;1β,α,β,μ)+12GD(x;1β,α,β,μ)=βe(|xμ|α)β2αΓ(1β),

μα>0β>0β=2β=1β(μα,μ+α)α=π2,β=1/2,1,4α=π2,β=2

введіть тут опис зображення

Вищезазначене можна розглядати як узагальнений нормальний розподіл Версія 1 і в різних параметризаціях відомий як експоненціальний розподіл потужності та узагальнений розподіл помилок, які, у свою чергу, є одним із кількох інших узагальнених нормальних розподілів .


2

Виведення хі-квадратного розподілу від звичайного розподілу набагато аналогічне виведенню гамма-розподілу з експоненціального розподілу.

Ми повинні мати можливість узагальнити це:

  • XimY=inXimn/m

Аналогія така:

Нормальні та Chi-квадратні розподіли відносяться до суми квадратів

  • xi2
    f(x1,x2,...,xn)=exp(0.5i=1nxi2)(2π)n/2

  • XiN(0,1)

    i=1nXi2χ2(ν)

Експоненціальні та гамма-розподіли відносяться до регулярної суми

  • xi

    f(x1,x2,...,xn)=exp(λi=1nxi)λn

  • XiExp(λ)

    i=1nXiGamma(n,λ)


x1,x2,...xn

χ2

fχ2(n)(s)ds=es/2(2π)n/2dVdsds=es/2(2π)n/2πn/2Γ(n/2)sn/21ds=12n/2Γ(n/2)sn/21es/2ds

V(s)=πn/2Γ(n/2+1)sn/2s .

Для розподілу гами:

fG(n,λ)(s)ds=eλsλndVdsds=eλsλnnsn1n!ds=λnΓ(n)sn1eλsds

V(s)=snn!xi<s .


Ynn експоненціально розподілених змінних.

Як вже зазначав Алекос Пападопулос, немає більш глибокого зв'язку, який робить суми квадратних звичайних змінних «хорошою моделлю для очікування часу». Гамма-розподіл - це розподіл для суми узагальнених нормальних розподілених змінних. Ось так вони збираються разом.

Але тип суми та тип змінних можуть бути різними. У той час як гамма-розподіл, отриманий від експоненціального розподілу (р = 1), отримує інтерпретацію експоненціального розподілу (час очікування), ви не можете повернутись назад і повернутися до суми квадратних гауссових змінних і використовувати ту саму інтерпретацію.

Розподіл щільності на час очікування, який падає експоненціально, і розподіл щільності для помилки Гаусса падає експоненціально (з квадратом). Це ще один спосіб бачити, як вони пов'язані.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.