Уніфікована випадкова величина як сума двох випадкових величин


18

Взяті від Гріммета та Стірцакера :

Покажіть, що не може бути випадку, що де рівномірно розподілено на [0,1], а і незалежні та однаково розподілені. Не слід вважати, що X і Y - суцільні змінні.U = X + YU=X+YU X YUXY

Простий доказ протиріччя достатній для випадку, коли , вважаються дискретними, стверджуючи, що завжди можна знайти і таких, що тоді як .X XY Yu uu u P ( U u + u ) P ( U u ) P(Uu+u)P(Uu)P ( X + Y u ) = P ( X + Y u + u )P(X+Yu)=P(X+Yu+u)

Однак це доказ не поширюється на є абсолютно безперервним або єдиним безперервним. Підказки / коментарі / критика?X , YX,Y


3
Підказка : Характерні функції - ваші друзі.
кардинал

1
X і Y - тому їх характерні функції повинні бути однаковими. Вам потрібно використовувати характеристичну функцію, не функцію, що генерує момент - mgf не гарантовано існує для X, тому показ mgf має неможливу властивість не означає, що такого X немає. Усі RV мають характерну функцію, тож якщо ви покажете, що має неможливе властивість, то такого X. немає
Срібна рибка

1
Якщо в розподілах і є атоми , скажіть, що , тоді і так не можна рівномірно розподілити на . Таким чином, зайвим вважати випадок розподілів і мають атоми. X XYYP { X = a } = P { Y = a } = b > 0 P{X=a}=P{Y=a}=b>0P { X + Y = 2 a } b 2 > 0 P{X+Y=2a}b2>0X + Y X+Y[ 0 , 1 ] [0,1]X XYY
Діліп Сарват

Відповіді:


13

Результат можна довести за допомогою малюнка: видимі сірі області показують, що рівномірний розподіл не може бути розбитий як сума двох незалежних однаково розподілених змінних.

Позначення

Нехай і є такими, що має рівномірний розподіл на . Це означає, що для всіх 0 a b 1 ,X XY YX + Y X+Y[ 0 , 1 ][0,1]0ab1

Pr ( a < X + Y b ) = b - a .

Pr(a<X+Yb)=ba.

Отже, суттєвою підтримкою спільного розподілу та є (бо в іншому випадку існує позитивна ймовірність того, що лежить поза ).X Y [ 0 , 1 / 2 ] Х + Y [ 0 , 1 ]XY[0,1/2]X+Y[0,1]

Фото

Нехай . Розгляньте цю діаграму, що показує, як обчислюються суми випадкових змінних:0 < ε < 1 / 40<ϵ<1/4

Малюнок

Основний розподіл ймовірностей є спільним для . Імовірність будь-якої події задається сумарною ймовірністю, охопленою діагональною смугою, що тягнеться між лініями і . Показано три такі смуги: від до , що з'являється як маленький синій трикутник у нижній лівій частині; від до , показаний у вигляді сірого прямокутника, обкладеного двома (жовтим та зеленим) трикутниками; і від до , маючи червоний трикутник у верхньому правому куті.( Х , Y ) < Х + Y б х + у = х + у = Ь 0 ε 1 / 2 - ε 1 / 2 + ε 1 - ε 1(X,Y)a < X+ Ybх + у= ах + у= b0ϵ1 / 2 - ε1 / 2 + ε1ϵ1

Що показує малюнок

Порівнюючи нижній лівий трикутник на рисунку з лівим нижнім квадратом, що містить його, та використовуючи припущення про iid для та , зрозуміло, щоX YXY

ϵ = Pr ( X + Y ϵ ) < Pr ( X ϵ ) Pr ( Y ϵ ) = Pr ( X ϵ ) 2 .

ϵ=Pr(X+Yϵ)<Pr(Xϵ)Pr(Yϵ)=Pr(Xϵ)2.

Зауважте, що нерівність сувора: рівність неможлива, оскільки існує деяка позитивна ймовірність того, що і і менше, ніж але все-таки .X Y ϵ X + Y > ϵXYϵX+Y>ϵ

Аналогічно, порівнюючи червоний трикутник з квадратом у верхньому правому куті,

ε = Pr ( Х + Y > 1 - ε ) < Рг ( Х > 1 / 2 - ε ) 2 .

ϵ=Pr(X+Y>1ϵ)<Pr(X>1/2ϵ)2.

Нарешті, порівняння двох протилежних трикутників у верхньому лівому та нижньому правому куті з діагональною смугою, що їх містить, дає ще одну сувору нерівність,

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

Перше нерівність випливає з двох попередніх (взяти їх квадратні корені і помножити їх) , а другий описує (строге) включення трикутників в межах смуги і остання рівність висловлює однорідність . Висновок, що є протиріччям, що доводить такі і не може існувати, QED .X+YX+Y2ϵ<2ϵ2ϵ<2ϵXXYY


3
(+1) Мені подобається такий підхід. Знову повертаючи конверт із кошика макулатури, я можу побачити, що я намалював ту саму схему, за винятком того, що на жовтому та зеленому трикутниках всередині смуги я не позначив. Я отримав нерівності для синього та червоного трикутників. Я розігрувався з ними та ще кількома ймовірностями, але ніколи не думав досліджувати ймовірність смуги, що виявляється критичним кроком. Цікаво, який мислительний процес міг би мотивувати це розуміння?
Срібна рибка

Насправді, де у @whuber є трикутники жовтого та зеленого кольору, я малював квадрати (я ефективно розклав в сітку). Дивлячись на крок, який "описує (суворе) включення трикутників всередині смуги", , мені цікаво, чи це насправді би було геометрично більш природним з квадратами, що обмежують смугу, ніж трикутники? [0,0.5]2[0,0.5]22Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)
Срібна рибка

1
@Silver Мені нагадали аналіз сум рівномірного розподілу, який я розмістив пару років тому. Це пропонувало візуалізувати суму геометрично. Одразу було видно, що велика ймовірність повинна бути зосереджена поблизу кутів та щоб сума була рівномірною і порівняно невеликою ймовірністю була біля центральної діагоналі . Це призвело до діаграми, яку я перекроював у Mathematica. У той момент відповідь написала сама. Так, використання квадратів у центральній смузі може бути акуратніше. X+YX+Y(0,0)(0,0)(1/2,1/2)(1/2,1/2)X+Y=1/2X+Y=1/2
whuber

Спасибі! "Зауважте, що нерівність сувора: рівність неможлива, оскільки існує деяка позитивна ймовірність того, що або X, або Y менше, ніж ϵ, але все-таки X + Y > ϵ ." Я не впевнений, що слідую за цим. Мені здається, мета тут - показати Pr ( X + Y ϵ ) < Pr ( X ϵ Y ϵ ) , це не вимагає позитивної ймовірності для якоїсь події A, в якій обидва X іXYϵX+Y>ϵPr(X+Yϵ)<Pr(XϵYϵ)A XY менше або дорівнює ϵ і все ж X + Y > ϵ ? Я коливаюсь, це "будь-який з" проти "обох". YϵX+Y>ϵ
Срібна рибка

@Silverfish Дякую; Я цього не висловив так, як мав намір. Ви маєте рацію: мова призначена по суті для опису частини маленького квадрата, не всередині трикутника.
whuber

10

Я намагався знайти доказ, не враховуючи характерних функцій. Зайвий куртоз робить свою справу. Ось дворядкова відповідь: Курт ( U ) = Курт ( X + Y ) = Курт ( X ) / 2, оскільки X і Y - iid. Тоді Курт ( U ) = - 1,2 означає Курт ( X ) = - 2,4, що є протиріччям, як Курт ( X )Kurt(U)=Kurt(X+Y)=Kurt(X)/2XYKurt(U)=1.2Kurt(X)=2.4- 2 для будь-якої випадкової величини.Kurt(X)2

Доволі цікавішою є суть міркувань, яка мене змусила до цього моменту. XY ) повинні бути обмежені між 0 і 0,5 - це багато очевидного, але корисно означає, що його моменти та центральні моменти існують. Почнемо з розгляду середнього та дисперсії: E ( U ) = 0,5 і Var ( U ) = 1XYE(U)=0.512 . ЯкщоXіYоднаково розподілені, то маємо:Var(U)=112XY

E ( X + Y ) = E ( X ) + E ( Y ) = 2 E ( X ) = 0,5

E(X+Y)=E(X)+E(Y)=2E(X)=0.5

Отже E ( X ) = 0,25 . Для відхилення нам потрібно додатково використовувати незалежність, щоб застосувати:E(X)=0.25

Var ( X + Y ) = Var ( X ) + Var ( Y ) = 2 Var ( X ) = 112

Var(X+Y)=Var(X)+Var(Y)=2Var(X)=112

Звідси Var ( X ) = 124 іσX=1Var(X)=1242 60,204. Оце Так! Це дуже багато варіацій для випадкової змінної, підтримка якої становить від 0 до 0,5. Але ми повинні були очікувати цього, оскільки стандартне відхилення не буде масштабуватися так, як це було середнє.σX=1260.204

Тепер, яке найбільше стандартне відхилення, яке може мати випадкова величина, якщо найменше значення, яке воно може взяти, дорівнює 0, найбільше значення, яке він може приймати, - 0,5, а середнє значення - 0,25? Зібравши всю вірогідність у двох точках на крайнощах, що знаходяться на відстані 0,25 від середньої величини, явно було б дано стандартне відхилення 0,25. Отже наш σ X великий, але не неможливий. (Я сподівався показати, що це передбачає занадто велику ймовірність, що лежить у хвостах, щоб X + Y була рівномірною, але я не міг нікуди потрапити з цим на звороті конверта.)σXX+Y

Міркування другого моменту майже не ставлять неможливе обмеження на X, тому давайте розглянемо вищі моменти. Що стосується коефіцієнта спотвореності Пірсона , γ 1 = E ( X - μ X ) 3Xσ 3 X =κ3κ 3 / 2 2 ? Це існує з моменту існування центральних моментів іσX0. Корисно знати деякі властивості кумулянтів, зокрема застосування незалежності та тотожного розподілу дає:γ1=E(XμX)3σ3X=κ3κ3/22σX0

κ i ( U ) = κ i ( X + Y ) = κ i ( X ) + κ i ( Y ) = 2 κ i ( X )

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

Ця властивість адитивності полягає саме в узагальненні того, як ми мали справу зі середнім значенням та дисперсією вище - дійсно, перший та другий кумулянти - це лише κ 1 = μ та κ 2 = σ 2 .κ1=μκ2=σ2

Тоді κ 3 ( U ) = 2 κ 3 ( Х ) і ( κ 2 ( U ) ) 3 / 2 = ( 2 κ 2 ( Х ) ) 3 / 2 = 2 3 / 2 ( κ 2 ( Х ) ) 3 / 2 . Фракція для γ 1 скасовує вихід Skew ( Uκ3(U)=2κ3(X)(κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2γ1) = Skew ( X + Y ) = Skew ( X ) / 2 . Оскільки рівномірний розподіл має нульовий нахил, так іX, але я не можу побачити, як виникає суперечність цього обмеження.Skew(U)=Skew(X+Y)=Skew(X)/2X

Тож замість цього спробуємо зайвий куртоз γ 2 = κ 4κ 2 2 =E(X-μX)4σ 4 X -3. Подібним аргументом (це питання є самостійним вивченням, тому спробуйте!), Ми можемо показати, що це існує і підкоряється:γ2=κ4κ22=E(XμX)4σ4X3

Курт ( U ) = Курт ( X + Y ) = Курт ( X ) / 2

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

Рівномірний розподіл має надлишок куртозу - 1,2, тому нам потрібно, щоб у Х був надлишковий куртоз - 2,4 . Але найменший можливий надлишок куртозу - 2 , що досягається двочленним ( 1 , 11.2X2.422 )Поширення Бернуллі.Binomial(1,12)


2
(+1) This is a quite clever approach, which was new to me. Thanks. Note that some of your analysis could have been streamlined by considering a uniform centered at zero. (The equivalence of the problem is immediate.) That would have immediately told you that considering skew was a dead-end.
cardinal

@cardinal: I knew the skew was a dead-end before I worked on it. The purpose was expository: it's a self-study question so I didn't want to solve it in full! Rather I wanted to leave a hint on how to deal with the next level up...
Silverfish

@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that Kurt(X1+...+Xn)=1nKurt(X)Kurt(X1+...+Xn)=1nKurt(X) for iid XiXi, (2) that Kurt(U)=1.2Kurt(U)=1.2 for any uniform distribution, and (3) Kurt(X)Kurt(X) exists since XX is bounded and σX0σX0 (which is trivial, else σU=0σU=0). So none of the key results actually required centering, though bits may have looked less ugly!
Silverfish

Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.
cardinal

@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g. fT(t)=12t2fT(t)=12t2 on [-0.5, 0.5], then Var(T)=.15Var(T)=.15 and if T=X1+X2T=X1+X2 then σX=.15/20.27>0.25σX=.15/20.27>0.25 which is impossible as XX is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.
Silverfish
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.