Чи можливо мати пару гауссових випадкових величин, для яких спільний розподіл не є гауссовим?


91

Хтось задав мені це запитання в інтерв'ю для роботи, і я відповів, що їх спільний розподіл завжди гауссовий. Я думав, що я завжди можу написати двозначного гаусса їх засобами та дисперсією та коваріацією. Мені цікаво, чи може бути випадок, для якого спільна ймовірність двох гауссів не є гауссом?


4
Ще один приклад з Вікіпедії . Звичайно, якщо змінні незалежні і незначно гауссові, то вони спільно є гауссовими.

Відповіді:


138

Нормальний розподіл двовимірне - це виняток , а не правило!

Важливо визнати, що "майже всі" спільні розподіли з нормальними маргіналами - це не двовимірний нормальний розподіл. Тобто загальна точка зору на те, що спільні розподіли з нормальними маргіналами, які не є двоваріантними нормальними, якимось чином є "патологічними", трохи помилково.

Безумовно, багатоваріантна норма є надзвичайно важливою завдяки своїй стійкості в умовах лінійних перетворень, і тому привертає основну увагу в додатках.

Приклади

Корисно почати з деяких прикладів. На малюнку нижче представлені теплові карти з шести двовимірних розподілів, всі вони мають стандартні нормальні межі. Лівий і середній у верхньому ряду є двовимірними нормалами, решта - ні (як має бути видно). Вони описані далі нижче.

Приклади біваріантного розподілу зі стандартними нормальними полями.

Голі кістки копул

Властивості залежності часто ефективно аналізуються за допомогою копул . Двовимірним копули це просто гарна назва для розподілу ймовірностей на одиницю площі з рівномірними маргінальними.[0,1]2

Припустимо, - це двофазна копула. Тоді, безпосередньо з вищесказаного, ми знаємо, що , і , наприклад.C ( u , v ) 0 C ( u , 1 ) = u C ( 1 , v ) = vC(u,v)C(u,v)0C(u,1)=uC(1,v)=v

Ми можемо побудувати біваріантні випадкові величини на евклідовій площині заздалегідь визначеними маргіналами простим перетворенням біваріантної копули. Нехай і призначені граничні розподіли для пари випадкових величин . Тоді, якщо є двовимірною копулою, - це функція розподілу біваріанта з маргіналами і . Щоб побачити цей останній факт, просто зауважте, що Цей же аргумент працює і для .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2F1F2(X,Y)C(u,v)

F(x,y)=C(F1(x),F2(y))
F1F2
P(Xx)=P(Xx,Y<)=C(F1(x),F2())=C(F1(x),1)=F1(x).
F2

Для безперервного і , теорема Скляр в стверджує оборотно припускає унікальність. Тобто, зважаючи на двовимірне розподіл з безперервними , , відповідна копула є унікальною (на відповідному просторі діапазону).F1F2F(x,y)F1F2

Біваріантна норма є винятковою

Теорема Склара говорить нам (по суті) про те, що існує лише одна копула, яка виробляє біваріантне нормальне розподіл. Це, влучно названий, копула Гаусса, яка має щільність на де чисельник є двовимірним нормальним розподілом з кореляцією оцінюється при і .[0,1]2

cρ(u,v):=2uvCρ(u,v)=φ2,ρ(Φ1(u),Φ1(v))φ(Φ1(u))φ(Φ1(v)),
ρΦ1(u)Φ1(v)

Але є багато інших копул, і всі вони дадуть біваріантний розподіл із нормальними маргіналами, що не є нормальним для двовимірного, використовуючи перетворення, описане в попередньому розділі.

Деякі деталі на прикладах

Зауважимо, що якщо - довільна копула з щільністю , відповідна біваріантна щільність зі стандартними нормальними маргіналами при перетворенні є C(u,v)c(u,v)F(x,y)=C(Φ(x),Φ(y))

f(x,y)=φ(x)φ(y)c(Φ(x),Φ(y)).

Зауважимо, що, застосувавши копулу Гаусса у наведеному рівнянні, ми відновимо біваріантну нормальну щільність. Але, для будь-якого іншого вибору , ми не будемо.c(u,v)

Приклади на малюнку були побудовані наступним чином (переходячи через кожен рядок, по одному стовпцю за раз):

  1. Двохмарне нормальне з незалежними компонентами.
  2. Двовимірний нормальний з .ρ=0.4
  3. Приклад , наведений в цій відповіді на Діліп Sarwate . Видно, що його викликає копула з щільністю .C(u,v)c(u,v)=2(1(0u1/2,0v1/2)+1(1/2<u1,1/2<v1))
  4. Згенеровано з копули Франка з параметром .θ=2
  5. Згенеровано з копули Клейтона з параметром .θ=1
  6. Згенеровано з асиметричної модифікації копули Клейтона з параметром .θ=3

7
+1 за зауваження, що біваріантна нормальна щільність - винятковий випадок!
Діліп Сарват

Можливо, мені чогось не вистачає, але якщо ми починаємо з , спільний розподіл визначається автоматично, незалежно від будь-якої побудови копули, і якщо ми застосуємо не- Побудова копули Гауса до їх CDF, це правда, що ми отримаємо CD, що не є гауссом CDF , але ця функція взагалі не буде CDF пари випадкових змінних ми почали, правда ? X1,X2N(0,1)(X1,X2)F(x1,x2)X,X2
RandomGuy

Приклад того, як імітувати, як на нижній правій панелі: library(copula) kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE))) # force normal margins evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1))) contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
половина проходу

1
@RandomGuy, у вас відсутнє невстановлене припущення, що . Якщо ви вважаєте, що вони незалежні, то так, ви вже знаєте спільний розподіл. Без припущення про незалежність, знання граничних розподілів не дає достатньо інформації для уточнення спільного розподілу. X1,X2independentN(0,1)
MentatOfDune

25

Це правда, що кожен елемент багатоваріантного нормального вектора сам по собі нормально розподілений, і ви можете вивести їх засоби та відхилення. Однак це неправда, що будь-які дві випадкові величини Гаассі спільно нормально розподіляються. Ось приклад:

Редагувати: У відповідь на єдину думку про те, що випадкову змінну, яка є точковою масою, можна розглядати як звичайно розподілену змінну з , я змінюю свій приклад.σ2=0


Нехай і нехай де - випадкова величина. Тобто кожен з вірогідністю .XN(0,1)Y=X(2B1)BBernoulli(1/2)Y=±X1/2

Спочатку покажемо, що має стандартне нормальне розподіл. YЗа законом повної ймовірності ,

P(Yy)=12(P(Yy|B=1)+P(Yy|B=0))

Далі,

P(Yy|B=0)=P(Xy)=1P(Xy)=1Φ(y)=Φ(y)

де - це звичайний звичайний CDF . АналогічноΦ

P(Yy|B=1)=P(Xy)=Φ(y)

Тому

P(Yy)=12(Φ(y)+Φ(y))=Φ(y)

значить, CDF є , таким чином .YΦ()YN(0,1)

Тепер ми покажемо, що не є спільно нормально розподіленими. X,YЯк зазначає @cardinal, одна характеристика багатоваріантної норми полягає в тому, що кожна лінійна комбінація її елементів нормально розподіляється. не мають цієї властивості, оскількиX,Y

Y+X={2Xif B=10if B=0.

Тому являє собою суміш випадкової величини і точкової маси при 0, тому її не можна нормально розподілити.Y+X50/50N(0,4)


4
Я не згоден з цією відповіддю. Вироджена точка маса по , як правило , вважаються виродженим гауссовской випадкової змінним з нульовою дисперсією. Крім того, не є спільно суцільними, хоча вони гранично неперервні. Для прикладу двох спільно неперервних випадкових величин, які є гауссовими, але не спільно гауссовими, див., Наприклад, другу половину цієї відповіді . 1μ(X,X)
Діліп Сарват

4
@DilipSarwate, питання полягало в тому, щоб навести приклад (якщо така існує) двох змінних, які зазвичай розподіляються, але їх спільний розподіл не є багатоваріантним нормальним. Це приклад. Більшість стандартних визначень нормального розподілу (наприклад, wikipedia en.wikipedia.org/wiki/Normal_distribution ) вимагають, щоб відхилення були суто позитивними, таким чином, не включаючи точкову масу як частину сімейства звичайних розподілів.
Макрос

4
Стандартна характеристика багатоваріантного Гаусса полягає в тому, що є багатоваріантним гауссом тоді і лише тоді, є гауссом для всіх . Як натякає @Dilip, варто подумати, чи це правда для вашого прикладу. XRnaTXaRn
кардинал

6
Оскільки ви, очевидно, не любите закликів до раціональності ;-), як щодо закликів до влади? (Це жарт, якщо це не очевидно.) Я просто трапився на цьому випадково, коли шукав щось інше: Приклад 2.4 , стор. 22 GAF Seber та AJ Lee, Лінійний регресійний аналіз , 2-е. ред., Вілі. Він цитує: "Нехай і поставить ... Таким чином, має багатоваріантний нормальний розподіл." YN(μ,σ2)Y=(Y,Y)Y
кардинал

5
Дискусія йде про визначення. Зрозуміло, що якщо матриця коваріації за визначенням необхідна, щоб бути не сингулярним, макрос подає приклад, але це не приклад відповідно до більш ліберального визначення, на яке посилається і @cardinal. Однією з вагомих причин віддати перевагу більш ліберальному визначенню є те, що тоді всі лінійні перетворення нормальних змінних є нормальними. Зокрема, в лінійній регресії з нормальними похибками залишки мають спільне нормальне розподіл, але матриця коваріації є сингулярною.
NRH

5

Наступний пост містить конфігурацію доказів, лише щоб дати основні ідеї та розпочати роботу.

Нехай - дві незалежні гауссові випадкові величини і буде z=(Z1,Z2)x=(X1,X2)

x=(X1X2)=(α11Z1+α12Z2α21Z1+α22Z2)=(α11α12α21α22)(Z1Z2)=Az.

Кожен , але оскільки вони обидві лінійні комбінації однакових незалежних r.vs, вони спільно залежать.XiN(μi,σi2)

Визначення Пара r.vs як кажуть, є двовимірним, нормально розподіленим, якщо його можна записати у вигляді лінійної комбінації незалежної нормальної r.vs .x=(X1,X2)x=Azz=(Z1,Z2)

Лема Якщо є двовимірною гауссовою, то будь-яка інша лінійна комбінація їх знову нормальна випадкова величина.x=(X1,X2)

Доказ . Тривіальний, пропущений, щоб нікого не образити.

Властивість Якщо є неспорідненими, то вони незалежні та навпаки.X1,X2

РозподілX1|X2

Припустимо, - такі ж гауссові r.vs, як і раніше, але припустимо, що вони мають позитивну дисперсію та нульове значення для простоти.X1,X2

Якщо - підпростір, що охоплюється , нехай і .SX2X1S=ρσX1σX2X2X1S=X1X1S

X1 і - лінійні комбінації , тому теж. Вони спільно гауссові, некоррельовані (доведіть це) та незалежні.X2zX2,X1S

Розкладання виконується з

X1=X1S+X1S
E[X1|X2]=ρσX1σX2X2=X1S

V[X1|X2]=V[X1S]=E[X1ρσX1σX2X2]2=(1ρ)2σX12.

Тоді

X1|X2N(X1S,(1ρ)2σX12).

Дві одновимірні гауссові випадкові величини є спільно гауссовими, якщо умови і теж гауссові.X,YX|YY|X


2
Не очевидно, як це спостереження відповідає на питання. Оскільки правило продукту є практично визначенням умовного розподілу, воно не особливе для бінормальних розподілів. Подальше твердження "тоді для того, щоб ..." не дає жодної причини: чому саме також повинні бути нормальними також умовні розподіли?
whuber

але я відповідаю на головне питання: "Мені цікаво, чи може бути випадок, для якого спільна ймовірність двох гауссів не є гауссом?". Отже, відповідь така: коли умовне не є нормальним. - допоміжний
допоміжний

2
Не могли б ви завершити цю демонстрацію? Зараз це лише твердження з вашого боку, без жодних доказів. Зовсім не видно, що це правильно. Це також неповно, тому що вам потрібно встановити існування: тобто ви повинні продемонструвати, що для спільного розподілу насправді можливо мати нормальні маргінали, але для яких хоча б один умовний ненормальний. Насправді це тривіально вірно, тому що ви можете вільно змінювати кожне умовне розподіл бінормального на множині міри нульових, не змінюючи його граничних знаків - але ця можливість, здається, суперечить вашим твердженням.
whuber

Привіт @whuber, я сподіваюся, що це допомагає більше. У вас є якісь пропозиції чи зміни? Я написав це дуже швидко, оскільки на даний момент у мене мало багато вільного часу :-), але я би цінував будь-які пропозиції чи покращення, які ви можете зробити. Кращий
допоміжний

(1) Що ви намагаєтесь довести? (2) Оскільки питання задається питанням, коли розподіл із гауссовими маргіналами не є спільно гауссовим, я не бачу, як цей аргумент призводить до чогось релевантного.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.