Перша частина запитання відповідає в коментарях до запитання: велика кількість дистрибутивів, що займаються фірмовою маркою, є багатомодальними, наприклад, будь-який розподіл Beta з і . Давайте перейдемо до другої частини питання.a < 1 b < 1( а , б )a < 1b < 1
Усі дискретні розподіли - це явно суміші (атомів, які є немодальними).
Я покажу, що більшість безперервних розподілів є також сумішами одномодальних розподілів. Інтуїція, що стоїть за цим, проста: ми можемо "зачищати" удари з грубих граф PDF, по одному, поки графік не буде горизонтальним. Шишки стають компонентами суміші, кожен з яких, очевидно, одномодовий.
Отже, за винятком, мабуть, деяких незвичайних дистрибутивів, PDF-файли яких є надзвичайно розривними, відповідь на питання "жоден": усі мультимодальні дистрибутиви, які є абсолютно безперервними, дискретніми або поєднання цих двох, є сумішами одномодальних розподілів.
Розглянемо безперервні дистрибутиви , PDF-файли яких безперервні (це "абсолютно безперервні" розподіли). (Безперервність не є великим обмеженням; її можна додатково послабити більш ретельним аналізом, припускаючи лише, що точки розриву дискретні.) FЖf
Щоб впоратися з "плато" постійних значень, які можуть виникнути, визначте "режим" інтервалом (який може бути єдиною точкою, де ) таким, щоx l = x um = [ xл, ху]xl=xu
м , уf має постійне значення на скажімо, .m,y
мf не є постійною на будь-якому інтервалі, який суворо містить .m
Існує додатне число таке, що максимальне значення досягнуте на дорівнює .f [ x l - ϵ , x u + ϵ ] yϵf[xl−ϵ,xu+ϵ]y
Нехай - будь-який режим . Оскільки є безперервним, є інтервали що містять для яких не зменшується в (що є правильним інтервалом, а не просто точкою) і не збільшується в (що також є належним інтервалом). Нехай є нескінченним з усіх таких значень, а рівнем всіх таких значень.f f [ x ′ l , x ′ u ] m f [ x ′ l , x l ] [ x u , x ′ u ] x ′ l x ′ um=[xl,xu]ff[x′l,x′u]mf[x′l,xl][xu,x′u]x′lx′u
Ця конструкція визначила один "горб" на графіку що від до . Нехай - більший від і . За побудовою набір точок у для яких - власний інтервал суворо містить (тому що він містить або ціле або ).x ′ l x ′ u y f ( x ′ l ) f ( x ′ u ) x [ x ′ l , x ′ u ] f ( x ) ≥ y m ′ m [ x ′ l , x l ] [ x u , x ′ u ]fx′lx′uyf(x′l)f(x′u)x[x′l,x′u]f(x)≥ym′m[x′l,xl][xu,x′u]
На цій ілюстрації мультимодального PDF, режим ідентифікується червоною крапкою на горизонтальній осі. Горизонтальна протяжність червоної частини заливки - це інтервал : це основа горба, визначена режимом . Основа цього горбка знаходиться на висоті . Оригінальний PDF - це сума червоної та синьої заливки. Зауважте, що синя заливка має лише один режим біля ; початковий режим при було знято.m ′ m y ≈ 0,16 2 [ 0 , 0 ]m=[0,0]m′my≈0.162[0,0]
Написаннядля довжини визначтем '|m′|m′
pm=PrF(m′)−y|m′|
і
fm(x)=f(x)−ypm
коли і іншому випадку. (Це , до речі, робить неперервною функцією.) Чисельник - це величина, на яку піднімається вище а знаменник - область між графіком і . Таким чином, є негативним та має загальну площу : це PDF-розподіл ймовірностей. За конструкцією він має унікальний режим .f m ( x ) = 0 f m f y p m f y f m 1 mx∈m′fm(x)=0fmfypmfyfm1m
Також за конструкцією, функцією
f′m(x)=f(x)−pmfm(x)1−pm
- PDF-файл, наданий . (Очевидно, якщо нічого не залишилося від яке, мабуть, було б одномодальним для початку.) Більше того, він не має режимів в інтервалі (де він постійний, тому попереднє ретельне визначення необхідний режим як інтервал). Крім того,p m = 1 f , m ′pm<1pm=1f,m′
f(x)=pmfm(x)+(1−pm)f′m(x)
являє собою суміш унімодального PDF та PDF .f ′ mfmf′m
Повторіть цю процедуру (яка як лінійна комбінація безперервних функцій все ще є безперервною функцією, що дозволяє нам діяти як і раніше), створюючи послідовність режимів ; відповідні послідовності ваг ; та PDF-файли Обмежуючий результат існує тому, що (a) інтервал, де сплющений, включає належний інтервал, який не був розгладжений у попередньому m = m 1 , m 2 , … p 1 = p m , p 2 = p m 2 , … f 1 = f m , f 2 = f m 2 , … . f i i - 1 ff′mm=m1,m2,…p1=pm,p2=pm2,…f1=fm,f2=fm2,….fii−1операції та (b) дійсні числа не можуть бути розбиті на більше, ніж обчислювальну кількість таких інтервалів. Границя не може мати жодних режимів і тому є постійною, яка повинна дорівнювати нулю (інакше її інтеграл буде розходитися). Отже, виражається (можливо, не однозначно, оскільки порядок, в якому вибираються режими, матиме значення) як сумішf
f(x)=∑ipifi(x)
унімодальних розподілів, КЕД.