Побудова розподілу Діріхле з розподілом Гамма


18

Нехай X1,,Xk+1 - взаємно незалежні випадкові величини, кожна з яких має розподіл гами з параметрами αi,i=1,2,,k+1 показують, що Yi=XiX1++Xk+1,i=1,,k, мають спільний розподіл у виглядіDirichlet(α1,α2,,αk;αk+1)

Спільний pdf з (X1,,Xk+1)=ei=1k+1xix1α11xk+1αk+11Γ(α1)Γ(α2)Γ(αk+1) Тоді, щоб знайти спільний pdf з(Y1,,Yk+1)я не можу знайти якобіан, тобтоJ(x1,,xk+1y1,,yk+1)


3
Погляньте на сторінки 13-14 цього документа .

@Procrastinator Дякую, що ваш документ найкраще відповідає на моє запитання.
Арґа

2
@Procrastinator - можливо, ви повинні поставити це як відповідь, оскільки ОП задоволений цим, і додайте пару пропозицій, щоб ви не відключили попередження "ми хочемо більше, ніж відповідь в одному реченні"?
jbowman

4
Цей документ зараз не відповідає, тому що це 404.
whuber

2
Автоматична
допомога

Відповіді:


30

Якобійці - абсолютні детермінанти зміни функції змінної - здаються грізними і можуть бути складними. Тим не менш, вони є важливою і неминучою частиною обчислення багатоваріантної зміни змінної. Здавалося б, для цього немає нічого, окрім як записати матрицю k+1 на k+1 похідних і зробити обчислення.

Є кращий спосіб. Це показано в кінці в розділі "Рішення". Оскільки мета цієї посади - ознайомити статистиків з тим, що може бути новим методом для багатьох, значна частина присвячена поясненню механізму рішення. Це алгебра диференціальних форм . (Диференціальні форми - це речі, які об'єднуються в декількох вимірах.) Доданий детальний, відпрацьований приклад, який допоможе зробити це більш звичним.


Фон

Понад століття тому математики розробили теорію диференціальної алгебри для роботи з "похідними вищого порядку", які зустрічаються в багатовимірній геометрії. Детермінант - це окремий випадок основних об'єктів, що маніпулюються такими алгебрами, які зазвичай є чергуванням багатолінійних форм . Краса цього полягає в тому, наскільки простими можуть стати розрахунки.

Ось усе, що вам потрібно знати.

  1. Диференціала є виразом виду « dxi ». Це з'єднання " d " з будь-якою назвою змінної.

  2. Один-форма являє собою лінійну комбінацію диференціалів, таких як або навіть х 2 д х 1 - ехр ( х 2 ) д х 2 . Тобто коефіцієнти - це функції змінних.dx1+dx2x2dx1exp(x2)dx2

  3. Форми можна "помножити", використовуючи клиновий добуток , написаний . Цей продукт є антикомутативним (його також називають чергуванням ): для будь-яких двох одноформатних ω і η ,ωη

    ωη=ηω.

    Це множення є лінійним та асоціативним: іншими словами, воно працює звично. Безпосереднім наслідком є ​​те, що , маючи на увазі, що квадрат будь-якої однієї форми завжди дорівнює нулю. Це робить розмноження надзвичайно простим!ωω=ωω

  4. Для маніпулювання інтегралами, які з'являються у ймовірних обчисленнях, такий вираз, як можна розуміти як | d x 1d x 2d x k + 1 | .dx1dx2dxk+1|dx1dx2dxk+1|

  5. Коли є функцією, то її диференціал задається диференціацією:y=g(x1,,xn)

    dy=dg(x1,,xn)=gx1(x1,,xn)dx1++gx1(x1,,xn)dxn.

Зв'язок з якобійцями такий: якобіан перетворення , до знака, просто коефіцієнт d x(y1,,yn)=F(x1,,xn)=(f1(x1,,xn),,fn(x1,,xn)) що з’являється в обчислювальній техніціdx1dxn

dy1dyn=df1(x1,,xn)dfn(x1,,xn)

після розширення кожного з як лінійної комбінації d x j у правилі (5).dfidxj


Приклад

Простота цього визначення якобіанців приваблива. Ще не впевнені, що варто? Розглянемо відому проблему перетворення двовимірних інтегралів з декартових координат в полярні координати ( r , θ ) , де ( x , y ) = ( r cos ( θ ) , r sin ( θ ) ) . Далі - цілком механічне застосування попередніх правил, де " ( )(x,y)(r,θ)(x,y)=(rcos(θ),rsin(θ))()"використовується для скорочення виразів, які, очевидно, зникнуть в силу правила (3), що означає .drdr=dθdθ=0

dxdy=|dxdy|=|d(rcos(θ))d(rsin(θ))|=|(cos(θ)drrsin(θ)dθ)(sin(θ)dr+rcos(θ)dθ|=|()drdr+()dθdθrsin(θ)dθsin(θ)dr+cos(θ)drrcos(θ)dθ|=|0+0+rsin2(θ)drdθ+rcos2(θ)drdθ|=|r(sin2(θ)+cos2(θ))drdθ)|=r drdθ.

The point of this is the ease with which such calculations can be performed, without messing about with matrices, determinants, or other such multi-indicial objects. You just multiply things out, remembering that wedges are anti-commutative. It's easier than what is taught in high school algebra.


Preliminaries

Let's see this differential algebra in action. In this problem, the PDF of the joint distribution of (X1,X2,,Xk+1) is the product of the individual PDFs (because the Xi are assumed to be independent). In order to handle the change to the variables Yi we must be explicit about the differential elements that will be integrated. These form the term dx1dx2dxk+1. Including the PDF gives the probability element

fX(x,α)dx1dxk+1(x1α11exp(x1))(xk+1αk+11exp(xk+1))dx1dxk+1=x1α11xk+1αk+11exp((x1++xk+1))dx1dxk+1.

(The normalizing constant has been ignored; it will be recovered at the end.)

Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable

Z=X1+X2++Xk+1,

giving the relationships

Xi=YiZ.

This suggests making the change of variables xiyiz in the probability element. The intention is to retain the first k variables y1,,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,

dxi=d(yiz)=yidz+zdyi.

Note that since Y1+Y2++Yk+1=1, then

0=d(1)=d(y1+y2++yk+1)=dy1+dy2++dyk+1.

Consider the one-form

ω=dx1++dxk=z(dy1++dyk)+(y1++yk)dz.

It appears in the differential of the last variable:

dxk+1=zdyk+1+yk+1dz=z(dy1++dyk)+(1y1yk)dz=dzω.

The value of this lies in the observation that

dx1dxkω=0

because, when you expand this product, there is one term containing dx1dx1=0 as a factor, another containing dx2dx2=0, and so on: they all disappear. Consequently,

dx1dxkdxk+1=dx1dxkzdx1dxkω=dx1dxkz.

Whence (because all products dzdz disappear),

dx1dxk+1=(zdy1+y1dz)(zdyk+ykdz)dz=zkdy1dykdz.

The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.


Solution

The transformation (x1,,xk,xk+1)(y1,,yk,z) is one-to-one: its inverse is given by xi=yiz for 1ik and xk+1=z(1y1yk). Therefore we don't have to fuss any more about the new probability element; it simply is

(zy1)α11(zyk)αk1(z(1y1yk))αk+11exp(z)|zkdy1dykdz|=(zα1++αk+11exp(z)dz)(y1α11ykαk1(1y1yk)αk+11dy1dyk).

That is manifestly a product of a Gamma(α1++αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1++αk+1), enabling the PDF to be written

fY(y,α)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)(y1α11ykαk1(1y1yk)αk+11).
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.