Чому всі відомі дистрибуції є одномодовими?


13

Я не знаю жодних мультимодальних розподілів.

Чому всі відомі дистрибуції є одномодовими? Чи є якийсь "відомий" дистрибутив, який має більше одного режиму?

Звичайно, суміші розподілів часто мультимодальні, але хотілося б знати, чи існують якісь "немішані" розподіли, які мають більше одного режиму.


5
Ви говорите про "стандартні" дистрибуції, а не про "відомі" дистрибуції.
Stéphane Laurent

12
Як щодо бета-версії з ? α=β=0.5
Амеба каже, що поверніть Моніку

1
Якщо ви не заперечуєте проти обмежених бімодальних розподілів , Вікіпедія також згадує U-квадратичний та дугоподібний розподіл . Я думаю, що це лише окремі випадки бета-розподілу ... У Вікіпедії також згадуються приклади природних явищ мультимодальних розподілів .
Нік Стаунер

12
@ StéphaneLaurent: Мені подобаються "дистрибуції фірмових найменувань" , тому що повідомлення про те, що названість, сама по собі не передбачає особливого статусу дистрибуції. "Відомі" дистрибуції звучать так, ніби решта може бути там, де чекають, коли її виявлять, як монстр Лох-Несса або темна матерія.
Scortchi

5
Чудово @Scortchi, чудовий словник! Багато вчених, що не мають математики, з якими я стикався, знаходяться під враженням, що розподілу без назви не існує. Можливо, за цим стоїть пов'язаний глибший філософський факт, плутанину імені та речі, що позначається цим ім'ям (як сказав Рассел, "Слово" собака "не нагадує собаку")
Стіфан Лоран

Відповіді:


17

Перша частина запитання відповідає в коментарях до запитання: велика кількість дистрибутивів, що займаються фірмовою маркою, є багатомодальними, наприклад, будь-який розподіл Beta з і . Давайте перейдемо до другої частини питання.a < 1 b < 1(a,b)a<1b<1

Усі дискретні розподіли - це явно суміші (атомів, які є немодальними).

Я покажу, що більшість безперервних розподілів є також сумішами одномодальних розподілів. Інтуїція, що стоїть за цим, проста: ми можемо "зачищати" удари з грубих граф PDF, по одному, поки графік не буде горизонтальним. Шишки стають компонентами суміші, кожен з яких, очевидно, одномодовий.

Отже, за винятком, мабуть, деяких незвичайних дистрибутивів, PDF-файли яких є надзвичайно розривними, відповідь на питання "жоден": усі мультимодальні дистрибутиви, які є абсолютно безперервними, дискретніми або поєднання цих двох, є сумішами одномодальних розподілів.


Розглянемо безперервні дистрибутиви , PDF-файли яких безперервні (це "абсолютно безперервні" розподіли). (Безперервність не є великим обмеженням; її можна додатково послабити більш ретельним аналізом, припускаючи лише, що точки розриву дискретні.) FFf

Щоб впоратися з "плато" постійних значень, які можуть виникнути, визначте "режим" інтервалом (який може бути єдиною точкою, де ) таким, щоx l = x um=[xl,xu]xl=xu

  1. м , уf має постійне значення на скажімо, .m,y

  2. мf не є постійною на будь-якому інтервалі, який суворо містить .m

  3. Існує додатне число таке, що максимальне значення досягнуте на дорівнює .f [ x l - ϵ , x u + ϵ ] yϵf[xlϵ,xu+ϵ]y

Нехай - будь-який режим . Оскільки є безперервним, є інтервали що містять для яких не зменшується в (що є правильним інтервалом, а не просто точкою) і не збільшується в (що також є належним інтервалом). Нехай є нескінченним з усіх таких значень, а рівнем всіх таких значень.f f [ x l , x u ] m f [ x l , x l ] [ x u , x u ] x l x um=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu]xlxu

Ця конструкція визначила один "горб" на графіку що від до . Нехай - більший від і . За побудовою набір точок у для яких - власний інтервал суворо містить (тому що він містить або ціле або ).x l x u y f ( x l ) f ( x u ) x [ x l , x u ] f ( x ) y m m [ x l , x l ] [ x u , x u ]fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymm[xl,xl][xu,xu]

Малюнок

На цій ілюстрації мультимодального PDF, режим ідентифікується червоною крапкою на горизонтальній осі. Горизонтальна протяжність червоної частини заливки - це інтервал : це основа горба, визначена режимом . Основа цього горбка знаходиться на висоті . Оригінальний PDF - це сума червоної та синьої заливки. Зауважте, що синя заливка має лише один режим біля ; початковий режим при було знято.m m y 0,16 2 [ 0 , 0 ]m=[0,0]mmy0.162[0,0]

Написаннядля довжини визначтем '|m|m

pm=PrF(m)y|m|

і

fm(x)=f(x)ypm

коли і іншому випадку. (Це , до речі, робить неперервною функцією.) Чисельник - це величина, на яку піднімається вище а знаменник - область між графіком і . Таким чином, є негативним та має загальну площу : це PDF-розподіл ймовірностей. За конструкцією він має унікальний режим .f m ( x ) = 0 f m f y p m f y f m 1 mxmfm(x)=0fmfypmfyfm1m

Також за конструкцією, функцією

fm(x)=f(x)pmfm(x)1pm

- PDF-файл, наданий . (Очевидно, якщо нічого не залишилося від яке, мабуть, було б одномодальним для початку.) Більше того, він не має режимів в інтервалі (де він постійний, тому попереднє ретельне визначення необхідний режим як інтервал). Крім того,p m = 1 f , m pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

являє собою суміш унімодального PDF та PDF .f mfmfm

Повторіть цю процедуру (яка як лінійна комбінація безперервних функцій все ще є безперервною функцією, що дозволяє нам діяти як і раніше), створюючи послідовність режимів ; відповідні послідовності ваг ; та PDF-файли Обмежуючий результат існує тому, що (a) інтервал, де сплющений, включає належний інтервал, який не був розгладжений у попередньому m = m 1 , m 2 , p 1 = p m , p 2 = p m 2 , f 1 = f m , f 2 = f m 2 , . f i i - 1 ffmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,.fii1операції та (b) дійсні числа не можуть бути розбиті на більше, ніж обчислювальну кількість таких інтервалів. Границя не може мати жодних режимів і тому є постійною, яка повинна дорівнювати нулю (інакше її інтеграл буде розходитися). Отже, виражається (можливо, не однозначно, оскільки порядок, в якому вибираються режими, матиме значення) як сумішf

f(x)=ipifi(x)

унімодальних розподілів, КЕД.


7

Однозначно, я думаю, що ОП однозначно означає, що існує лише один внутрішній режим (тобто виключаючи кутові рішення). Таким чином, питання справді задає ...

why is it that brand name distributions do NOT have more than one interior mode?

тобто чому більшість дистрибутивів брендів виглядають приблизно так:

введіть тут опис зображення

... плюс чи мінус деякі перекоси або деякі розриви? Якщо питання поставлене таким чином, розподіл Beta не був би дійсним зустрічним прикладом.

Здається, гіпотеза OP має деяку обґрунтованість: більшість розповсюджених торгових марок не дозволяють використовувати більше одного внутрішнього режиму. Для цього можуть бути теоретичні причини. Наприклад, будь-який розподіл, який є членом сім'ї Пірсонів (до складу якого входить бета), обов'язково буде (внутрішнім) одномодальним, як наслідок батьківського диференціального рівняння, яке визначає всю родину. А сім'я Пірсонів гніздиться більшістю найвідоміших торгових марок.

Тим не менш, ось кілька прикладів лічильника торгових марок ...

Приклад лічильника

Одним із прикладів зустрічного найменування торгової марки є розповсюдження з pdf:Sinc2

f(x)=sin2(x)πx2

визначені за реальною лінією. Ось сюжет pdf:Sinc2

введіть тут опис зображення

Ми також можемо додати сімейство кардіода та дистрибутивів, пов’язаних із цим класом ... з pdf-сюжетами, такими як:

введіть тут опис зображення

Сімейство відображених дистриб'юторів торгових марок також, можливо, буде можливим конкурентом на ім'я торгової марки (хоча, це може бути розглянуто як "чіт-рішення" ... але вони все ще є торговими марками), наприклад, відображений тут Weibull:

введіть тут опис зображення


1
Мій, цей сюжет впевнений, що він має деякі негативні значення! (Це може бути артефакт побудови?) ... І розподіли кардіоїдів виглядають так, що вони мають лише один внутрішній режим. Sinc2
whuber

1
Привіт @whuber ... повинен погодитись щодо побудови артефакту (я візьму це на Mathematica SE!). Про сім'ю кардіодів: ідея полягає в тому, що можна розширити область таких сімей, як будь ласка, і, як синусова хвиля, вона продовжує надавати :)
wolfies

1
(+1) Це дивний артефакт: ваш останній сюжет (із відображеними розподілами), схоже, його не демонструє. Ви можете простежити генерацію точок сюжету в сюжеті, щоб побачити, де вони лежать; Я підозрюю, що незначні негативні значення можуть бути завищенням сплайну невеликої кількості балів. Sinc2
whuber

Я думаю, що це лише тому, що намічена лінія товща, ніж лінія осі, тому, здається, "перекриває" вісь, коли близька до нуля. Якщо лінія накреслена тоншою, артефакт зникає.
вовчі

Але в вашій нижній фігурі немає такого артефакту, який також має лінії, товщі осі.
whuber

3

Те, що ви можете ні про що не думати, не означає, що їх немає.

Я можу назвати "відомі" дистрибутиви, які не є одномодовими.

Наприклад, розподіл Бета з і і .β < 1αβ<1

http://en.wikipedia.org/wiki/Beta_distribution

також див

http://en.wikipedia.org/wiki/U-quadratic_distribution

(Це не особливий випадок розподілу бета-версії, незважаючи на коментар, який говорить про це. Однак у двох сімей деякі перекриття.)

Розподіл сумішей, безумовно, відомий, і багато з них є мультимодальними.


U-квадратик - це усічений бета-розподіл.
бекко

1

Нормальний розподіл альфа-перекосу (Elal-Olivero 2010) має PDF:

(1αxμσ)2+12+α2φ(xμσ),

де - PDF стандартного гаусса.φ

Для розподіл є бімодальним. Прикладний сюжет для :|α|>1.34μ=1,σ=0.5,a=2

введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.