Чи може хтось запропонувати приклад унімодального розподілу, який має косий нуль, але який не є симетричним?


31

У травні 2010 року користувач Вікіпедії Mcorazao додав речення до статті про косості, що "нульове значення вказує на те, що значення відносно рівномірно розподілені по обидві сторони середнього, як правило, але не обов'язково мають на увазі симетричний розподіл". Однак на сторінці wiki немає фактичних прикладів розповсюджень, які порушують це правило. "Приклад асиметричних розподілів з нульовим нахилом" Гуглінга також не дає реальних прикладів, принаймні у перші 20 результатів.

Використовуючи визначення, що перекос обчислюється , іформула RE[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Я можу побудувати невеликий, довільний розподіл, щоб зробити косий низький. Наприклад, розподіл

x = c(1, 3.122, 5, 4, 1.1) 

дає косо . Але це невеликий зразок, і більше того, відхилення від симетрії не велике. Отже, чи можна побудувати більший розподіл з одним піком, який є дуже асиметричним, але все ще має косисть майже нуля?5.64947105


3
Ви хочете, щоб розподіл було одномодальним чи ні? Заголовок говорить так, але текст ледь згадує цей пункт.
Діліп Сарват

@Dilip Так, мені було б цікавіше, якби розподіл був одноманітним, оскільки косоокість як центральний момент насправді не має сенсу інакше.
Енді Маккензі

Відповіді:


28

Розглянемо дискретні розподіли. Те, що підтримується на значеннях x 1 , x 2 , , x k , визначається негативними ймовірностями p 1 , p 2 , , p k за умови, що (a) вони дорівнюють 1 та (b) коефіцієнт перекосу дорівнює 0 (що дорівнює третьому центральному моменту, що дорівнює нулю). Це залишає k - 2 ступеня свободи (у розумінні рівняння, а не в статистичному!). Ми можемо сподіватися знайти рішення, які не є одномодовими.kx1,x2,,xkp1,p2,,pkk2

Щоб полегшити пошук прикладів, я шукав рішення, підтримувані на малому симетричному векторі з унікальним режимом при 0 , нульовій середній і нульовій косості . Одним із таких рішень є ( p 1 , , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 ,x=(3,2,1,0,1,2,3)0 .(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Імовірнісна функція

Ви можете бачити, що це асиметрично.

Ось більш очевидно асиметричний розв’язок з (що несиметрично) і p = ( 1 , 18 , 72 , 13 , 4 ) / 108 :x=(3,1,0,1,2)p=(1,18,72,13,4)/108

Імовірнісна функція 2

Тепер очевидно, що відбувається: оскільки середнє значення дорівнює , від'ємні значення вносять ( - 3 ) 3 = - 27 і 18 × ( - 1 ) 3 = - 18 в третій момент, тоді як додатні значення вносять 4 × 2 3 = 32 і 13 × 1 3 = 13 , точно врівноважуючи від’ємні внески. Ми можемо взяти симетричний розподіл приблизно 0 , наприклад x =0(3)3=2718×(1)3=184×23=3213×13=130 з p = ( 1 , 4 , 1 ) / 6 , і переміщуємо невелику масу з + 1 до + 2 , трохи маси з + 1 вниз до - 1 , і невелику кількість маси вниз до - 3 , підтримуючи середнє значення 0 і косий на 0x=(1,0,1)p=(1,4,1)/6+1+2+11300також створюючи асиметрію. Цей же підхід буде працювати для підтримання нульової середньої та нульової косості безперервного розподілу, роблячи її асиметричною; якщо ми не будемо занадто агресивними з масовим зміщенням, воно залишиться одномодальним.


Правка: безперервні дистрибуції

Оскільки проблема постійно виникає, давайте наводимо чіткий приклад із постійними розповсюдженнями. У Пітера Флома була гарна ідея: подивіться суміші нормалів. Суміш двох нормалей не обійдеться: коли її косисть зникне, вона буде симетричною. Наступний найпростіший випадок - це суміш трьох нормалей.

Після відповідного вибору місця розташування та масштабу суміші трьох нормалей залежать від шести реальних параметрів, і тому вони повинні мати більш ніж достатню гнучкість для отримання асиметричного рішення з нульовим нахилом. Щоб знайти їх, нам потрібно знати, як обчислити похибки сумішей нормалів. Серед них ми будемо шукати будь-які, що не є одномодовими (можливо, їх немає).

rthr2r/2Γ(1r2)/πσrthσrμrthr

(μ,σ)(0,1)(1/2,1)(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60.05192161/6

Безперервні приклади

Сюжети вказують, що вони є одномодовими. (Ви можете перевірити, використовуючи Calculus, щоб знайти локальні максимуми.)


(+1) Дуже хитра відповідь. Чи буде це працювати при безперервному розповсюдженні? Чи не зміна потенційно створить крихітні маленькі режими? Я, можливо, не думаю прямо ...
Макрос

1
Ти досить добре думаєш, Макро: ми всі повинні бути настільки скептичними. Хитрість полягає в тому, щоб змістити невеликі кількості, що розподіляються в широких межах. Тест на першу похідну дасть змогу перевірити можливі режими, а також дає підставу для підтвердження того, що достатньо крихітні зрушення цієї форми не призведуть до нових режимів.
whuber

Дякую за відповідь! Це схоже на те, що я інтуїтивно думав, хоча я не міг добре сказати це словами - що вам доведеться "врівноважувати" масу з кожного боку розподілу. Мене змушує замислитися, чи існують стереотипні способи, за допомогою яких можна виконати цей балансуючий акт.
Енді Маккензі

Один із способів, Енді, - почати з дискретного рішення, а потім обернути його нормальним розподілом. У цьому випадку вимога унімодальності змусить нормальне розподіл мати велике стандартне відхилення. Незважаючи на це, якщо згортка не помітно змінить необхідні властивості (наприклад, нульова скасованість) або вона змінить її передбачуваними способами, у вас є математична обробка проблеми. У деякому сенсі мою недавню редакцію можна розглядати як таку атаку, хоча це не є суворо згорткою (оскільки три нормалі мають різні стандартні відхилення).
whuber

2
Я перевірив, Енді: перетворення дискретного розчину з нормальним розподілом не змінює косості. Якщо ви отримаєте звичайне відхилення звичайного розподілу приблизно 0,57 або більше, результат є одномодальним. Як і основний дискретний розподіл, він продовжує мати нульове середнє значення, нульову косисть і бути несиметричним. Змішування цього із звичайним нормальним розподілом означає контрольоване переміщення маси між стандартним нормальним та дискретним розподілом: це може задовольнити ваш запит щодо "стереотипного" методу.
whuber

23

k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Він має середнє значення 0,5387, середнє відхилення 0,2907, косостість 0,0000 та куртоз 2,0000. Джерело також називає його "слоновим розповсюдженням": введіть тут опис зображення

Моє відтворення в R було створено с

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

врожайний

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15

Дякую за редагування З цього приводу я не міг відтворити нахил 0,0000 до чотирьох цифр, отримавши натомість 0,0001245138 (див. Наступне редагування, у коді R).
Крістоф Хенк

ck

Власне, 0,0003756196. 0.0001245138 вже був після деякої початкової оптимізації, даної тут помилково. Я буду дивитись.
Крістоф Хенк

@amoeba, я спробував трохи оптимізувати, але я не стверджую, що зробив це розумно, у мене мало досвіду оптимізації.
Крістоф Хенк

2
Шкідливість, яка дорівнює нулю до трьох цифр (майже чотири), була мені на думку; це не так, як більш точне значення змусить його виглядати інакше. Якщо косостість перетне нуль у тій околиці, і зрозуміло, в яких напрямках змінювати значення, якщо потрібна більша точність, я вважаю, що це достатньо. Але кудо за додаткові зусилля. (До речі, це прекрасний приклад.)
Glen_b -Встановіть Моніку

9

Розглянемо розподіл на позитивну половину реальної лінії, яка лінійно збільшується від 0 до режиму, а потім є експоненціальною праворуч від режиму, але є безперервною у режимі.

Це можна назвати трикутно-експоненціальним розподілом (хоча це часто схоже на плавник акули).

θλ

λθλθ6.15

Трикутна-Експоненціальна з нульовою косою

[1][2]

Нитка Ненормальні розподіли з нульовим нахилом і нульовим надлишком куртозу? має кілька асиметричних прикладів, включаючи невеликий дискретний приклад та інший безперервний одномодальний:

Унімодальна гауссова суміш з нульовим нахилом

Дискретні унімодальні розподіли - або, що рівнозначно, зразки - з нульовою косою конструкцією досить легко побудувати, великого або малого розміру.

Ось приклад, який можна розглядати як зразок або (діливши необроблені частоти на 3000) як pmf (значення 'x' - це прийняті значення, 'n' - це кількість разів, коли значення виникає у вибірці ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Сюжет функції ймовірнісної маси, побудованої із наведеного

Цей приклад створений з триточкового розподілу:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

ccinixi=0inixi3=0c

Існують усі способи побудови інших таких "атомів", але в цьому прикладі використовується лише цей один вид. До деякої комбінації атомів, таких як ці, додається кілька симетрично розміщених значень, щоб заповнити залишки отворів і гарантувати нерівномірність без руйнування структури середнього та третього моменту.

[1]


[2]



3
Можна, можливо, назвати його «акулою»?
Glen_b -Встановити Моніку

@Glen_b Дійсно акулячий плавник справді.
Алекос Пападопулос

2

Звичайно. Спробуйте це:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Ви вже зробили важкі речі!)


1
приємно, мені це подобається. +1
gung - Відновити Моніку

4
Це не бімодально ... це жахливо багатомодально . Спробуйте побудувати графік щільності; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
гість

1
Дані, отримані таким чином, безумовно, не є одномодовими. Все, що вам потрібно зробити, щоб побачити, що це вирізати і вставити код, дослівно. Дійсно, суміш нормально розподілених змінних ніколи не буде одномодальною (якщо, звичайно, одна з пропорцій суміші дорівнює 1).
Макрос

8
@Macro, це не правильно. Дивіться, наприклад, конспект Roeder 1994 (JASA) для добре відомого результату, що "щільність двох змішаних нормалей не є бімодальною, якщо засоби не розділені принаймні двома стандартними відхиленнями". Якщо їх розділити менше, ніж це, суміш є одномодовою.
гість

1
Ви правий @guest. Я забув про таку можливість, коли я виголосив свій пост
Макрос

2

E[(Xμσ)3]=0
E[(Xμσ)3|Xμ]+E[(Xμσ)3|X>μ]=0.

YZμ

E[(Yμσ)3]=E[(Zμσ)3]
XYμ(μZ)

YZμμ


1
Як ви гарантуєте, що розподіл є одномодальним?
Діліп Сарват

YZμ

σYZ

@whuber: Чорт. Я знав, що повинен бути якийсь
підвод

2

Такий дискретний розподіл є несиметричним і має нульовий нахил: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Я знайшов це в роботі Doric et al., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9


+1 Це перевіряється, і це одномовно. Ось найпростіший можливий приклад.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.