Чому працює згортка?

Тому я знаю, що якщо ми хочемо знайти розподіл ймовірності суми незалежних випадкових величин , ми можемо обчислити його з розподілу ймовірностей і , сказавши $X + Y$ $X$ $Y$

f_{X + Y} (a) = \int_{x = - \infty}^{\infty} f_{X, Y} (X = x, Y = a - x) d x = \int_{x = - \infty}^{\infty} f_{X} (x) f_{Y} (a - x) d x

$f_{X + Y}(a) = \int_{x = -\infty}^{\infty} f_{X, Y}(X = x, Y = a - x)~dx = \int_{x = -\infty}^{\infty} f_X(x) f_Y(a - x)~dx$

Інтуїтивно це має сенс, тому що якщо ми хочемо знайти ймовірність того, що дві випадкові величини дорівнюють , це в основному сума ймовірностей усіх подій, що призводять до того, що ці змінні підсумовуються до . Але як я можу офіційно довести це твердження? $a$ $a$

probability

— Джессіка
джерело

Питання дещо інше, але відповідь схожа .

— Карл

Відповіді:

Більш загальним рішенням вважається де і не обов'язково незалежні. Загальна стратегія вирішення проблем, коли вам цікаво, звідки взявся PDF або як його обґрунтувати, - знайти накопичувач, ймовірно, замість цього, а потім диференціювати, щоб зменшити CDF до PDF. $Z = X + Y$ $X$ $Y$

Досить легко побачити, що в такому випадку де - область площини - для якої . $F_Z(z) = \mathrm{P}(Z \leq z) = \int \int_R f_{X,Y}(x,y)\,\mathrm{d}x\,\mathrm{d}y$ $R$ $x$ $y$ $x + y \leq z$

Це блакитно-штрихована область на схемі нижче. Цілком природно інтегруватися в цей регіон, розбиваючи його на смужки - я це робив з вертикальними смугами, але горизонтальні будуть. Ефективно закінчую смужку для кожної координати , починаючи з до , і вздовж кожної смуги я хочу, щоб значення не піднімалися вище лінії , тому . $x$ $-\infty$ $\infty$ $y$ $x + y = z$ $y \leq z - x$

z <x + y

Тепер ми отримали межі інтеграції з точки зору і , ми можемо зробити підстановку , наступним чином з метою отримання щоб відображатись як верхня межа . Математика проста, якщо ви розумієте використання якобіанців для зміни змінних. $x$ $y$ $u=x$ $v=x+y$ $z$ $v$

F_{Z} (z) = \int_{x = - \infty}^{x = \infty} \int_{y = - \infty}^{y = z - x} f_{X, Y} (x, y) d x d y = \int_{v = - \infty}^{v = z} \int_{u = - \infty}^{y = \infty} f_{X, Y} (u, v - u) d u d v

$F_Z(z) = \int_{x = -\infty}^{x=\infty}\int_{y=-\infty}^{y=z-x}f_{X,Y}(x,y)\,\mathrm{d}x\,\mathrm{d}y = \int_{v = -\infty}^{v=z}\int_{u=-\infty}^{y=\infty}f_{X,Y}(u,v-u)\,\mathrm{d}u\,\mathrm{d}v$

Поки будуть виконані певні умови, ми можемо диференціювати за цілісним знаком відносно щоб отримати: $z$

f_{Z} (z) = \int_{- \infty}^{\infty} f_{X, Y} (u, z - u) d u

$f_Z(z) = \int_{-\infty}^{\infty}f_{X,Y}(u, z-u)\,\mathrm{d}u$

Це працює, навіть якщо і не є незалежними. Але якщо вони є, ми можемо переписати щільність суглоба як добуток двох граничних: $X$ $Y$

f_{Z} (z) = \int_{- \infty}^{\infty} f_{X} (u) f_{Y} (z - u) d u

$f_Z(z) = \int_{-\infty}^{\infty}f_X(u)f_Y(z-u)\,\mathrm{d}u$

Фіктивну змінну можна без шкоди записати як за бажанням. $u$ $x$

Моє позначення інтегралів точно відповідає Розділу 6.4 Джеффрі Гріммета та Домініка Уолша, ймовірність: вступ , Oxford University Press, Нью-Йорк, 2000.

— Срібна рибка
джерело

+1 Щодо позначення, умовна умова полягає в тому, що різниця на зовнішній стороні кратного інтеграла стосується зовнішнього інтеграла; таким чином, у виразі форми інтеграція відносно робиться спочатку - це внутрішній інтеграл - і це відносно робиться останнім - це зовнішній інтеграл. Це дозволяє нам розміщувати дужки без зміни значення, як у .

\iint \dots d x d y

$\iint \cdots \mathrm{d}x\,\mathrm{d} y$

x

$x$

y

$y$

\int (\int \dots d x) d y

$\int\left(\int \cdots \mathrm{d}x\right)\mathrm{d}y$

— whuber

@whuber, розмірковуючи про це, це, безумовно, умова, яка застосовується майже у кожному підручнику, який я знаю (тому багаторазова інтеграція є ефективно вкладеними інтегралами). Але, пролітаючи крізь, Гріммет і валлійський "Ймовірність: Вступ" абсолютно відповідають їх власній конвенції одного і того ж ліво-правого порядку як для меж, так і для диференціалів, наприклад, вони дають !

\int_{u} \int_{v} \int_{w} . . . d u d v d w

$\int_u \int_v \int_w ... du\,dv\,dw$

— Срібна рибка

Мене постійно розважає те, як на перехресті багатьох полів ми піддаємось суперечливим умовам. Це одна з радощів роботи з людьми різного походження.

— whuber

@whuber Я знаю, що конвенції щодо встановлення інтегралів різняться між країнами - це вам сподобається від Tex SE tex.stackexchange.com/a/88961/25866, і я хотів би, щоб він був розширений, щоб охопити багаторазову інтеграцію!

— Срібна рибка

Твердження справедливе тоді і лише тоді, коли права частина діє як щільність для ; це є, $X+Y$

F_{X + Y} (a) = P (X + Y \leq a) = \int_{- \infty}^{a} f_{X + Y} (z) d z = \int_{- \infty}^{a} (\int f_{X} (x) f_{Y} (z - x) d x) d z

$F_{X+Y}(a)=\mathbb{P}(X+Y\le a) = \int_{-\infty}^a f_{X+Y}(z)\,\mathrm{d}z = \int_{-\infty}^a \left(\int f_X(x) f_Y(z-x)\,\mathrm{d}x\right)\mathrm{d}z$

для всіх . Перевіримо це, починаючи з правого боку. $a$

Застосуйте теорему Фубіні, щоб змінити порядок інтегрування та здійснити підстановку . Детермінанта її якобіян - , тому додаткові терміни не вводяться при цій зміні змінних. Зауважте, що оскільки і знаходяться у відповідності один до одного і якщо і лише якщо , ми можемо переписати інтеграл як $z = x+y$ $1$ $z$ $y$ $-\infty \lt z \le a$ $-\infty \lt y \lt a-x$

= \int (\int_{- \infty}^{a - x} f_{X} (x) f_{Y} (y) d y) d x .

$=\int \left(\int_{-\infty}^{a-x}f_X(x)f_Y(y)\,\mathrm{d} y\right)\mathrm{d}x.$

За визначенням це інтеграл над of $\mathbb{R}^2$

= \iint I (x + y \leq a) f_{X} (x) f_{Y} (y) d y d x

$=\iint I(x+y\le a)f_X(x)f_Y(y)\,\mathrm{d}y\,\mathrm{d}x$

де - функція індикатора набору. Нарешті, оскільки і незалежні, для всіх , виявляючи інтеграл як просто очікування $I$ $X$ $Y$ $f_{(X,Y)}(x,y) = f_X(x)f_Y(y)$ $(x,y)$

= \iint I (x + y \leq a) f_{(X, Y)} (x, y) d y d x = E (I (X + Y \leq a)) = P (X + Y \leq a),

$=\iint I(x+y\le a)f_{(X,Y)}(x,y)\,\mathrm{d}y\,\mathrm{d}x = \mathbb{E}(I(X+Y\le a))=\mathbb{P}(X+Y\le a),$

за бажанням.

Загалом, навіть коли один або обидва з або не мають функції розподілу, ми все одно можемо отримати $X$ $Y$

F_{X + Y} (a) = E_{X} (F_{Y} (a - X)) = E_{Y} (F_{X} (a - Y))

$F_{X+Y}(a) = \mathbb{E}_X\left(F_Y(a-X)\right) = \mathbb{E}_Y\left(F_X(a-Y)\right)$

безпосередньо з базових визначень, використовуючи очікування показників переходити назад і вперед між ймовірностями та очікуваннями, використовуючи припущення про незалежність, щоб розбити обчислення на окремі очікування щодо і : $X$ $Y$

\begin{aligned} P (X + Y \leq a) & = E (I (X + Y \leq a)) \\ = E_{X} (E_{Y} (I (X + Y \leq a)) \\ = E_{X} (P_{Y} (Y \leq a - X)) \\ = E_{X} (F_{Y} (a - X)) . \end{aligned}

$\eqalign{ \mathbb{P}(X+Y\le a) &= \mathbb{E}(I(X+Y\le a)) \\ &= \mathbb{E}_X\left(\mathbb{E}_Y(I(X+Y\le a)\right) \\ &= \mathbb{E}_X\left(\mathbb{P}_Y(Y\le a-X)\right) \\ &=\mathbb{E}_X(F_Y(a-X)). }$

Сюди входять звичайні формули для дискретних випадкових змінних, наприклад, хоч і дещо в іншій формі, ніж зазвичай (тому що це висловлено з точки зору CDF, а не функції масової ймовірності).

Якщо у вас є достатньо сильна теорема про взаємозамінні похідні та інтеграли, ви можете диференціювати обидві сторони відносно щоб отримати щільність одним штрихом, $a$ $f_{X+Y}$

\begin{aligned} f_{X + Y} (a) & = \frac{d}{d a} F_{X + Y} (a) = E_{X} (\frac{d}{d a} F_{Y} (a - X)) = E_{X} (f_{Y} (a - X)) \\ = \int f_{X} (x) f_{Y} (a - x) d x . \end{aligned}

$\eqalign{ f_{X+Y}(a) &= \frac{\mathrm{d}}{\mathrm{d}a} F_{X+Y}(a) =\mathbb{E}_X\left(\frac{\mathrm{d}}{\mathrm{d}a} F_Y(a-X)\right) = \mathbb{E}_X \left(f_Y(a-X)\right) \\ &= \int f_X(x) f_Y(a-x) \,\mathrm{d} x. }$

— дзижчати
джерело