Чому працює згортка?


11

Тому я знаю, що якщо ми хочемо знайти розподіл ймовірності суми незалежних випадкових величин , ми можемо обчислити його з розподілу ймовірностей і , сказавшиX YX+YXY

fX+Y(a)=x=fX,Y(X=x,Y=ax) dx=x=fX(x)fY(ax) dx

Інтуїтивно це має сенс, тому що якщо ми хочемо знайти ймовірність того, що дві випадкові величини дорівнюють , це в основному сума ймовірностей усіх подій, що призводять до того, що ці змінні підсумовуються до . Але як я можу офіційно довести це твердження?aaa


Питання дещо інше, але відповідь схожа .
Карл

Відповіді:


10

Більш загальним рішенням вважається де і не обов'язково незалежні. Загальна стратегія вирішення проблем, коли вам цікаво, звідки взявся PDF або як його обґрунтувати, - знайти накопичувач, ймовірно, замість цього, а потім диференціювати, щоб зменшити CDF до PDF.X YZ=X+YXY

Досить легко побачити, що в такому випадку де - область площини - для якої .R x y x + y zFZ(z)=P(Zz)=RfX,Y(x,y)dxdyRxyx+yz

Це блакитно-штрихована область на схемі нижче. Цілком природно інтегруватися в цей регіон, розбиваючи його на смужки - я це робив з вертикальними смугами, але горизонтальні будуть. Ефективно закінчую смужку для кожної координати , починаючи з до , і вздовж кожної смуги я хочу, щоб значення не піднімалися вище лінії , тому .- y x + y = z y z - xxyx+y=zyzx

z <x + y

Тепер ми отримали межі інтеграції з точки зору і , ми можемо зробити підстановку , наступним чином з метою отримання щоб відображатись як верхня межа . Математика проста, якщо ви розумієте використання якобіанців для зміни змінних.xyu=xv=x+yzv

FZ(z)=x=x=y=y=zxfX,Y(x,y)dxdy=v=v=zu=y=fX,Y(u,vu)dudv

Поки будуть виконані певні умови, ми можемо диференціювати за цілісним знаком відносно щоб отримати:z

fZ(z)=fX,Y(u,zu)du

Це працює, навіть якщо і не є незалежними. Але якщо вони є, ми можемо переписати щільність суглоба як добуток двох граничних:XY

fZ(z)=fX(u)fY(zu)du

Фіктивну змінну можна без шкоди записати як за бажанням.ux

Моє позначення інтегралів точно відповідає Розділу 6.4 Джеффрі Гріммета та Домініка Уолша, ймовірність: вступ , Oxford University Press, Нью-Йорк, 2000.


+1 Щодо позначення, умовна умова полягає в тому, що різниця на зовнішній стороні кратного інтеграла стосується зовнішнього інтеграла; таким чином, у виразі форми інтеграція відносно робиться спочатку - це внутрішній інтеграл - і це відносно робиться останнім - це зовнішній інтеграл. Це дозволяє нам розміщувати дужки без зміни значення, як у . dxdyxy(dx)dy
whuber

1
@whuber, розмірковуючи про це, це, безумовно, умова, яка застосовується майже у кожному підручнику, який я знаю (тому багаторазова інтеграція є ефективно вкладеними інтегралами). Але, пролітаючи крізь, Гріммет і валлійський "Ймовірність: Вступ" абсолютно відповідають їх власній конвенції одного і того ж ліво-правого порядку як для меж, так і для диференціалів, наприклад, вони дають ! uvw...dudvdw
Срібна рибка

Мене постійно розважає те, як на перехресті багатьох полів ми піддаємось суперечливим умовам. Це одна з радощів роботи з людьми різного походження.
whuber

@whuber Я знаю, що конвенції щодо встановлення інтегралів різняться між країнами - це вам сподобається від Tex SE tex.stackexchange.com/a/88961/25866, і я хотів би, щоб він був розширений, щоб охопити багаторазову інтеграцію!
Срібна рибка

10

Твердження справедливе тоді і лише тоді, коли права частина діє як щільність для ; це є,X+Y

FX+Y(a)=P(X+Ya)=afX+Y(z)dz=a(fX(x)fY(zx)dx)dz

для всіх . Перевіримо це, починаючи з правого боку.a

Застосуйте теорему Фубіні, щоб змінити порядок інтегрування та здійснити підстановку . Детермінанта її якобіян - , тому додаткові терміни не вводяться при цій зміні змінних. Зауважте, що оскільки і знаходяться у відповідності один до одного і якщо і лише якщо , ми можемо переписати інтеграл якz=x+y1zy<za<y<ax

=(axfX(x)fY(y)dy)dx.

За визначенням це інтеграл над ofR2

=I(x+ya)fX(x)fY(y)dydx

де - функція індикатора набору. Нарешті, оскільки і незалежні, для всіх , виявляючи інтеграл як просто очікуванняIXYf(X,Y)(x,y)=fX(x)fY(y)(x,y)

=I(x+ya)f(X,Y)(x,y)dydx=E(I(X+Ya))=P(X+Ya),

за бажанням.


Загалом, навіть коли один або обидва з або не мають функції розподілу, ми все одно можемо отриматиXY

FX+Y(a)=EX(FY(aX))=EY(FX(aY))

безпосередньо з базових визначень, використовуючи очікування показників переходити назад і вперед між ймовірностями та очікуваннями, використовуючи припущення про незалежність, щоб розбити обчислення на окремі очікування щодо і :XY

P(X+Ya)=E(I(X+Ya))=EX(EY(I(X+Ya))=EX(PY(YaX))=EX(FY(aX)).

Сюди входять звичайні формули для дискретних випадкових змінних, наприклад, хоч і дещо в іншій формі, ніж зазвичай (тому що це висловлено з точки зору CDF, а не функції масової ймовірності).

Якщо у вас є достатньо сильна теорема про взаємозамінні похідні та інтеграли, ви можете диференціювати обидві сторони відносно щоб отримати щільність одним штрихом,afX+Y

fX+Y(a)=ddaFX+Y(a)=EX(ddaFY(aX))=EX(fY(aX))=fX(x)fY(ax)dx.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.