Чому суміш двох нормально розподілених змінних є лише бімодальною, якщо їхні значення відрізняються щонайменше вдвічі від загального стандартного відхилення?


28

Під сумішшю двох нормальних розподілів:

https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions

"Суміш двох нормальних розподілів має п'ять параметрів для оцінювання: два засоби, дві дисперсії та параметр змішування. Суміш двох нормальних розподілів з рівними стандартними відхиленнями є бімодальною, лише якщо їхні значення відрізняються щонайменше вдвічі від загального стандартного відхилення . "

Я шукаю виведення або інтуїтивне пояснення, чому це правда. Я вважаю, що це може бути пояснено у вигляді тесту з двох зразків:

μ1μ2σp

де - об'єднане стандартне відхилення.σp


1
інтуїція полягає в тому, що якщо засоби занадто близькі, то в масі 2 щільності буде занадто багато перекриттів, тому різниця в засобах не буде помічена, оскільки різниця просто загрожує масі двох щільності. Якщо два засоби досить різні, то маси цих двох густин не будуть накладатися на стільки, і різниця в засобах буде помітна. Але я хотів би бачити математичне підтвердження цього. Це нетересна заява. Я ніколи цього не бачив.
mlofton

2
Більш офіційно, для суміші 50:50 двох нормальних розподілів з однаковим SD σ, якщо записати щільність f(x)=0.5g1(x)+0.5g2(x) у повному вигляді, що показує параметри, ви побачимо, що його друга похідна змінює знак у середині точки між обома засобами, коли відстань між засобами збільшується знизу 2σ до вище.
BruceET

1
Див. "Критерій Релея", en.wikipedia.org/wiki/Angular_resolution#Explanation
Carl Witthoft

Відповіді:


53

Ця цифра з паперу, зв'язаного у цій статті Вікі, є чудовою ілюстрацією: введіть тут опис зображення

Доказ, який вони надають, ґрунтується на тому, що нормальні розподіли є увігнутими в межах однієї SD від їх середньої величини (SD є точкою перегину нормального pdf, де він переходить від увігнутого до опуклого). Таким чином, якщо ви додасте два звичайних pdfs разом (у рівних пропорціях), то поки їхні засоби відрізняються менше ніж на два SD, сума-pdf (тобто суміш) буде увігнутою в області між двома засобами, і отже глобальний максимум повинен бути в точці між двома засобами.

Довідка: Шиллінг, М. Ф., Уоткінс, А. Е., і Уоткінс, В. (2002). Чи бімодальний зріст людини? Американський статистик, 56 (3), 223–229. doi: 10.1198 / 00031300265


11
+1 Це приємний, незабутній аргумент.
whuber

2
Заголовок фігури також дає гарну ілюстрацію того, що лігатура 'fl' перетворюється на помилку в «перегині» :-P
некоматичний

2
@Axeman: Дякую за те, що я додав цю довідку - оскільки це трохи підірвало, я сам планував її додати, оскільки я справді просто повторюю їх аргументи, і я не хочу брати за це занадто велику суму.
Рубен ван Берген

14

Це випадок, коли зображення можуть бути оманливими, оскільки цей результат є особливою характеристикою звичайних сумішей: аналог не обов'язково має місце для інших сумішей, навіть коли компоненти симетричні одномодальні розподіли! Наприклад, рівномірна суміш двох розподілів Стьюдента t, розділених трохи менше, ніж удвічі більше їх загального стандартного відхилення, буде бімодальною. Для реального розуміння тоді нам потрібно зробити певну математику або звернутися до спеціальних властивостей нормальних розподілів.


Виберіть одиниці вимірювання (від центрування і перемасштабування по мірі необхідності) для розміщення коштів складових розподілів на ±μ, μ0, і зробити їх загальну дисперсію єдності. Нехай p, 0<p<1, буде сума більшого середнього компонента в суміші. Це дозволяє нам виразити щільність суміші в повній загальності як

2πf(х;мк,p)=pдосвід(-(х-мк)22)+(1-p)досвід(-(х+мк)22).

Оскільки обидві щільності компонентів збільшуються там, де х<-мк а зменшуються там, де х>мк, є єдино можливі режими, де -мкхмк. Знайдіть їх, диференціюючи f відносно х і встановивши його на нуль. Очищення будь-яких отриманих позитивних коефіцієнтів

0=-е2хмкp(х-мк)+(1-p)(х+мк).

fе2хмк

f''(х;мк,p)(1+х2-мк2)х-мк.

-мк<х<мк,f''-(1-мк2+х2).мк1,мк1

2мк,

Суміш нормальних розподілів є немодальним, коли засоби відокремлюються не більше ніж удвічі, ніж загальне стандартне відхилення.

Це логічно рівнозначно твердженню у питанні.


12

Коментар зверху, вставлений тут для наступності:

f(х)=0,5г1(х)+0,5г2(х)

Продовження коментаря:

σ=1.3σ,2σ,σ,

введіть тут опис зображення

R код для фігури:

par(mfrow=c(1,3))
  curve(dnorm(x, 0, 1)+dnorm(x,3,1), -3, 7, col="green3", 
    lwd=2,n=1001, ylab="PDF", main="3 SD: Dip")
  curve(dnorm(x, .5, 1)+dnorm(x,2.5,1), -4, 7, col="orange", 
    lwd=2, n=1001,ylab="PDF", main="2 SD: Flat")
  curve(dnorm(x, 1, 1)+dnorm(x,2,1), -4, 7, col="violet", 
    lwd=2, n=1001, ylab="PDF", main="1 SD: Peak")
par(mfrow=c(1,3))

1
всі відповіді були чудовими. Спасибі.
mlofton

3
2/30,001.

1
0,1% fх0)
f(х0)-f(х)0,001f(х0)  |х-х0|0,333433,
0,0010,95832
f(х0)-f(х)0,001  |х-х0|0,47916.

Хороші бали. Власне, те, що я мав на увазі під скороченою мовою 'плоский', було нульовою другою похідною точно в середині точки.
BruceET
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.