Яка найдивніша характеристика гауссового (нормального) розподілу?


52

Стандартизований розподіл Гаусса на можна визначити, чітко вказавши його щільність: R

12πex2/2

або його характерна функція.

Як згадується в цьому питанні, це також єдиний розподіл, для якого середнє значення та дисперсія вибірки не залежать.

Які ще дивовижні альтернативні характеристики гауссових заходів, які ви знаєте? Я прийму найдивовижнішу відповідь

Відповіді:


39

Моє особисте найдивовижніше - це про середню вибірку та дисперсію вибірки, але ось ще одна (можливо) дивна характеристика: якщо і IID з кінцевою дисперсією, незалежно від і , то і є нормальними.XYX+YXYXY

Інтуїтивно ми зазвичай можемо ідентифікувати, коли змінні не є незалежними за допомогою розсіювача. Тож уявіть розсип пар пар, який виглядає незалежним. Тепер поверніть на 45 градусів і подивіться знову: якщо воно все ще виглядає незалежним, то координати і окремо повинні бути нормальними (звичайно, це все говорить вільно).X Y(X,Y)XY

Щоб зрозуміти, чому працює інтуїтивний біт, погляньте

[cos45sin45sin45cos45][xy]=12[xyx+y]

3
Джей - це в основному повторне твердження про те, що середня величина і дисперсія є незалежними. - це середньомасштабне середнє значення, а - масштабоване стандартне відхилення. X - YX+YXY
ймовірністьлогічний

5
@probabilityislogic - мені подобається інтуїція того, що ви сказали, але я не думаю, що це саме перерахунок, тому що не зовсім переосмислення SD: SD забуває знак. Отже незалежність середнього значення та SD випливає з незалежності , (коли ), але не навпаки. Можливо, це було те, що ви мали на увазі під принципом "в основному". У всякому разі, це хороші речі. X + Y X - Y n = 2XYX+YXYn=2

4
Де ми можемо знайти докази цієї властивості?
Рой

1
@Royi див. 16. тут . Для (а) зауважимо, що . Для (б) зауважимо, що який прагне заміни з якого ви отримуєте . Якщо , то , отже, для всіх , і є послідовність така, що і для всіх , що суперечить безперервності приφ ( 2 t ) φ ( - 2 t ) = ( φ ( t ) φ ( - t ) ) 4 ψ ( t ) = φ ( t ) φ ( - t ) ψ ( t ) = ψ 2 2 n2X=(X+Y)+(XY)φ(2t)φ(2t)=(φ(t)φ(t))4ψ(t)=φ(t)φ(t)φ(t0)=0ψ(t0)=0nψ(t0ψ(t)=ψ22n(t2n)φ(t0)=0ψ(t0)=0ntntn0φ(tn)=0nφ0ψ(t02n)=0tntn0φ(tn)=0nφ0. (c) є прямим [продовження]
Габріель Ромон

1
Для (d), . Зауважимо, що , отже, . Вставте це в попередньому рівність і довести , що при фіксованому , , яке означає для всіх . Це означає, що є реальною, і рівність у (a) перетворюється на те, що задається. Знову доведіть, що і використовуйте щоб отримати . Звідси іφ(t)=1-t2γ(t)=γ2n(t2n)φ(t)=1t22+o(t2)γ(t)=1+o(t2)tγ(t)=1tφφ(t)=φ22n(tlimnγ2n(t2n)=1γ(t)=1tφφ(t)=1-t2φ(t)=φ22n(t2n)limnφ2 2 n (tφ(t)=1t22+o(t2)φ(т)=е-т2/2Хlimnφ22n(t2n)=et2/2φ(t)=et2/2X нормальний.
Габріель Ромон


22

Про це написана ціла книга: "Характеристики нормального закону ймовірності", А. М. Матей та Г. Пердерзолі. Короткий огляд JASA (грудень 1978 р.) Згадує таке:

Нехай - незалежні випадкові величини. Тоді і є незалежними, де , якщо і тільки тоді, коли [нормально розподіляються].n i = 1 a i x in i = 1 b i x i a i b i0 X iX1,,Xni=1naixii=1nbixiaibi0Xi


3
повинна бути така умова, як відсутня? наприклад, якщо n = 2 і не є незалежними. a i = b i = 1 X 1 + X 2 X 1 + X 2<a,b>=0ai=bi=1 X1+X2X1+X2
Робін Жирард

1
@robin хороший улов. Я також спантеличував неявні квантори. На жаль, все, що у мене є, - це те, що цитують цитату з рецензії, а не книгу. Було б весело знайти її в бібліотеці та переглядати її ...
whuber

Це відчувається як узагальнення відповіді Г. Джея Кернса (наразі №1).
vqv

Я думаю, ви можете шукати папери Лукача і Кінга (1954). Дивіться цю відповідь на math.SE із посиланням на вищезгаданий документ.
кардинал

2
Якщо ця пропозиція говорить "де ", чи означає це для ВСІХ наборів скаларів, де "? Де "слід використовувати для пояснення свого позначення, як у" де швидкість світла, а - валовий внутрішній продукт "тощо.a i b i0 c gaibi0aibi0cg
Майкл Харді

17

Гауссові розподіли - єдині стійкі за сумою розподіли з кінцевою дисперсією.


8
Те, що вони є стабільними за сумою і що вони є унікальними з кінцевою дисперсією, обидва нас змушують CLT. Цікавою частиною цього твердження є те, що існують інші стабільні за сумою розподіли!
whuber

1
@whuber: справді! ця характеристика трохи спотворена, а інші, стабільні за сумою розподіли, можливо, більш цікаві.
shabbychef

@whuber насправді, я не бачу, як CLT має на увазі цей факт. Це, здається, говорить нам про те, що асимптотично сума нормалей є нормальною, а не те, що будь-яка кінцева сума нормально розподілена. Або вам доведеться якось також використовувати теорему Слуцького?
shabbychef

3
Прийнявши звичайну стандартизацію, сума двох нормалей - це сума одного нормального розподілу X_0 плюс граничний розподіл рядів X_1, X_2, ..., звідки сума є граничним розподілом X_0, X_1, ..., яка Ліндеберг-Леві CLT - це нормально.
whuber

17

Лема Штейна дає дуже корисну характеристику. є стандартним гауссовим iff для всіх абсолютно неперервних функцій з .E f ( Z ) = E Z f ( Z ) f E | f ( Z ) | < Z

Ef(Z)=EZf(Z)
fE|f(Z)|<

12

Теорема [Гершель-Максвелл]: Нехай - випадковий вектор, для якого (i) проекції на ортогональні підпростори є незалежними, і (ii) розподіл залежить тільки від довжини. Тоді нормально розподілений. Z Z ZZRnZZZ

Цитується Джорджем Коббом у « Навчальній статистиці»: Деякі важливі напруження (Чилійська Дж. Статистика, т. 2, № 1, квітень 2011 р.) На с. 54.

Кобб використовує цю характеристику як вихідну точку для отримання розподілів , і , не використовуючи обчислення (або теорії ймовірностей великої кількості). т Fχ2tF


9

Нехай і - дві незалежні випадкові величини із спільним симетричним розподілом таким, щоξηξ

P(|ξ+η2|t)P(|ξ|t).

Тоді ці випадкові величини є гауссовими. (Очевидно, якщо і в центрі гаусса, це правда.)ξη

Це теорема Бобкова-Ходре


9

Це не характеристика, а здогадка, яка бере свій початок з 1917 року і пов'язана з Кантеллі:

Якщо - позитивна функція на а і є незалежними випадковими змінними, такими, що є нормальним, то - константа майже скрізь.fRXYN(0,1)X+f(X)Yf

Тут згадав Герард Летак .


добре, що ви це згадуєте! Я не можу зрозуміти інтуїцію, чи не так?
Робін Жирард

@robin Це робить цю гіпотезу такою особливою: абсолютно елементарне твердження, деякі очевидні підходи, які невдало провалюються (характерні функції), і одному не можна зрозуміти ... До речі, чи варто робити ставку на те, що гіпотеза справжня чи помилковим? Навіть це не очевидно (для мене).
Чи

2
Якби Жерар Летак не зумів це довести, це може тривалий час залишатися відкритим здогадом ...!
Сіань

@ Xi'an: Звичайно, я повністю згоден. (Не знав, що ти роумуєш у цих кварталах Інтернету ... Гарні новини, що ти є.)
Чи

6
@ Сіань Ось препринт Віктора Клепцин і Аліни Kurtzmann з контрприклад до гіпотези Кантеллі. У конструкції використовується новий інструмент, який автори називають броунівським масовим транспортом, і він дає переривчасту функцію . Автори констатують, що вони вважають, що гіпотеза Кантеллі справедлива, якщо запитати, що є безперервним (їхня суміш двох безперервних функцій). ff
Чи

8

Припустимо, що це оцінка параметра розташування за допомогою даних iid . Якщо - максимальний показник вірогідності, то розподіл вибірки є гауссовим. Відповідно до теорії ймовірності Джейнеса : Логіка науки, с. 202-4, саме так Гаусс її спочатку вивів.{x1,...,xn}x¯


Я не впевнений, що розумію це як характеристику нормального розподілу, тому мені, мабуть, щось не вистачає. Що робити , якщо ми мали дані н.о.р. Пуассона і хотів оцінити ? MLE є але розподіл вибірки не є гауссовим - по-перше, повинен бути раціональним; по-друге, якби це був Гаусс, то це було б але це . μx¯x¯x¯xiPoisson(nμ)
Срібна рибка

2
Середнє значення Пуассона - не параметр розташування!
kjetil b halvorsen

6

Більш конкретна характеристика нормального розподілу серед класів нескінченно поділених розподілів представлена ​​у Стютел та Ван Харн (2004) .

Невироджена нескінченно подільна випадкова величина має нормальний розподіл, якщо і тільки якщо вона задовольняє X

lim supxlogP(|X|>x)xlog(x)=.

Цей результат характеризує нормальний розподіл з точки зору його хвостової поведінки.


1
Короткий доказ заявленої межі полягає в наступному: Якщо є звичайним нормальним, то як , так . Але тому результат випливає. Приблизний ескіз для випадку Пуассона, схоже, вказує на те, що дана межа є , але я не перевіряв цього занадто уважно. XxP(X>x)/φ(x)1xlogP(X>x)logφ(x)+logx02logφ(x)x2λ
кардинал

6

У контексті згладжування зображення (наприклад, масштабний простір ) Гаусс є єдиним ротаційно-симетричним роздільним * ядром.

Тобто, якщо нам потрібен де , то обертальна симетрія вимагає що еквівалентно .

F[x,y]=f[x]f[y]
[x,y]=r[cosθ,sinθ]
Fθ=f[x]f[y]xθ+f[x]f[y]yθ=f[x]f[y]y+f[x]f[y]x=0f[x]xf[x]=f[y]yf[y]=const.
log[f[x]]=cx

Якщо вимагає, щоб було належним ядром, тоді константа повинна бути від'ємною та початковою величиною позитивною, даючи ядра Гаусса.f[x]


* У контексті розподілу ймовірностей роздільні засоби означають незалежність, тоді як у контексті фільтрації зображень це дозволяє звести 2D згортку обчислювально до двох 1D згортків.


2
+1 Але це не випливає з негайного застосування теореми Гершеля-Максвелла у 2D?
whuber

@whuber Дійсно, мені якось вдалося не помітити вашу відповідь, переглядаючи цю тему!
Амеба каже, що повернеться до Моніки

@whuber Так. Я детально не читав цю стару тему і просто додавав цю відповідь на запит.
GeoMatt22

1
@amoeba дивіться також тут .
GeoMatt22

3

Нещодавно Ейсмонт [1] опублікував статтю з новою характеристикою Гауссана:

Нехай є незалежними випадковими векторами з усіма моментами, де невироджені, і нехай статистика мають розподіл, який залежить лише від , де і . Тоді є незалежними і мають однаковий нормальний розподіл з нульовими значеннями і для .(X1,,Xm,Y) and (Xm+1,,Xn,Z)Xii=1naiXi+Y+Zi=1nai2aiR1m<nXii { 1 , , n }cov(Xi,Y)=cov(Xi,Z)=0i{1,,n}

[1]. Ейсмонт, Віктор. "Характеристика нормального розподілу незалежністю пари випадкових векторів". Статистика та ймовірнісні листи 114 (2016): 1-5.


1
Це тонка і захоплююча характеристика. Дякуємо, що покращили цю тему, поділившись нею!
whuber

1

Його характерна функція має таку ж форму, як і її pdf. Я не впевнений у іншому розподілі, який це робить.


4
Дивіться цю мою відповідь щодо способів побудови випадкових змінних, характерні функції яких такі ж, як і їхні pdfs.
Діліп Сарват

-1

Очікування плюс мінус стандартного відхилення - це точки сідла функції.


11
Це, безумовно, властивість нормального розподілу, але це не характеризує його, оскільки велика кількість інших розподілів також має цю властивість.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.