За яким розподілом відбувається обернена нормальна CDF бета-випадкової змінної?


14

Припустимо, Ви визначаєте:

XBeta(α,β)

YΦ1(X)

де - зворотна CDF стандартного нормального розподілу .Φ1

Моє запитання: чи існує простий розподіл, який слід , або який може наближати ? YY Y α β α = 1 ; β = 1 X YЯ запитую, оскільки у мене є сильні підозри на основі результатів моделювання (показано нижче), що переходить до нормального розподілу, коли і високі, але я не знаю, чому це буде математично. (Звичайно, коли , X буде рівномірним, а Y - стандартним нормальним, але чому це буде істинно для більш високих значень?).Yαβα=1;β=1XY

Якщо це збігається з нормальним, якими би були параметри цієї норми, з точки зору α та β ? (Я очікую, що середнє значення буде Φ1(αα+β) оскільки це трансформація режиму, але я не знаю стандартного відхилення).

(По-іншому, це може бути запитання "чи Φ(Norm(μ,σ)) переходить до бета-розподілу для певного напрямку μ та σ "? Я не впевнений, чи це простіше відповісти).

Результати моделювання

Тут я показую, чому я підозрюю, що результат є нормальним (оскільки я не можу зробити це резервним з математикою). Моделювання можна виконати в R з і . Наприклад, вибираючи високі параметри та :α = 3000 β = 7000Yqnormrnormα=3000β=7000

hist(qnorm(rbeta(5000, 3000, 7000)))

Це дійсно виглядає нормально, а qqnormй на тест Шапіро-Wilk (в якій нормальність є нульова гіпотеза) Пропонуйте так само:

qqnorm(qnorm(rbeta(5000, 3000, 7000)))

shapiro.test(qnorm(rbeta(5000, 3000, 7000)))
#> 
#>  Shapiro-Wilk normality test
#> 
#> data:  qnorm(rbeta(5000, 3000, 7000))
#> W = 0.99954, p-value = 0.2838

Щоб вивчити нормальність трохи глибше, я виконую 2000 моделювання, кожен раз імітуючи 5000 значень від , потім виконую тест, щоб порівняти його з нормальним. (Я вибрав значення 5K, тому що це максимальний вміст, і максимізує потужність для виявлення відхилень від норми).Yshapiro.test

Якби розподіл справді був нормальним, ми очікували б, що р-значення було б рівномірним (оскільки нульове значення відповідає дійсності). Вони дійсно близькі до рівномірних, що дозволяє припустити, що розподіл дуже близький до нормального:

hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 3000, 7000)))$p.value))

Деякі експерименти показують, що чим вище і , тим ближче розподіл стає нормальним (наприклад, це досить далеко від нормального, але спробуйте, і, здається, він знаходиться десь між ними).βαβrbeta(5000, 3, 7)hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 30, 70)))$p.value))


2
Тут нічого цікавого не відбувається. Оскільки і зростають, припустимо, що вони залишаються в однаковій пропорції, або принаймні, що залишається далеко від і . Тоді розподіл бета стає нормальним і сконцентрованим у довільно вузькому діапазоні. , будучи диференційованим, стає по суті лінійним, звідси ви просто дивитесь на лінійну трансформацію майже нормальної змінної. Цей результат не має нічого спільного з самим і не додає жодної інформації про бета-версії. β α / ( α + β ) 0 1 ( α , β ) Φ - 1 Φ - 1αβα/(α+β)01(α,β)Φ1Φ1
качан

1
@whuber Це має сенс для великих та (у мене були деякі симуляції, які змусили мене думати, що це ближче до нормального, ніж еквівалент нормальному приблизно до бета, але після повторного повторювання, я вважаю, що у мене була помилка в той час). Будь-які думки про ; ? Dist є дуже далеким від нормального, але qnorm його досить близький. β α = 2 β = 2αβα=2β=2
Девід Робінсон

1
Наприклад, спробуйте hist(replicate(1000, shapiro.test(rbeta(5000, 2, 2))$p.value)), значить hist(replicate(1000, shapiro.test(qnorm(rbeta(5000, 2, 2)))$p.value)). Іншими словами, коли це нормально, тому що бета рівномірна, коли і є високими, це тому, що бета приблизно нормальна, але чому вона працює, коли вони рівні і між ними , де це ні нормально, ні рівномірно? α βα=β=1αβ
Девід Робінсон

5
Це, безумовно, цікавіше! Ви впевнені, що Beta не дуже близький до Normal, але перетворення приблизно нормальне, навіть для малих параметрів Beta. Відхилення від нормальності стають очевидними у хвостах, навколо або більше, але напрочуд невеликі у всьому тілі розподілу. Зрештою, це простежується до правової поведінки хвостів Beta. Z=±3
whuber

Відповіді:


7

Конспект

Ви знову виявили частину побудови, описану в теоремі про центральний межа для зразків медіанів , яка ілюструє аналіз медіани вибірки. (Аналіз, очевидно, застосовується, mutatis mutandis , до будь-якого квантилу, а не лише до медіани). Тому не дивно, що для великих параметрів бета-версії (що відповідають великим вибіркам) нормальне розподіл виникає при перетворенні, описаному в питанні. Цікавить, наскільки близький до нормального розподіл навіть для малих бета-параметрів. Це заслуговує пояснення.

Я начертаю аналіз нижче. Щоб зберегти цю посаду на розумній тривалості, це передбачає безліч натякаючих руками: я прагну лише вказати на ключові ідеї. Тому дозвольте підвести підсумки тут:

  1. Коли близьке до , все симетрично. Це призводить до того, що трансформований розподіл вже виглядає нормальним.βαβ

  2. Функції форми в першу чергу виглядають досить нормально, навіть для малих значень і (за умови, що обидва перевищують і їх співвідношення не надто близько до або ). α β 1 0 1Φα1(x)(1Φ(x))β1αβ101

  3. Очевидна нормальність трансформованого розподілу пояснюється тим, що його щільність складається з нормальної щільності, помноженої на функцію в (2).

  4. У міру збільшення та відхід від Нормальності може бути виміряний в решті в серії Тейлора для щільності журналу. Термін порядку зменшується пропорційно потужностям і . Це означає, що в кінцевому підсумку для досить великих та всі умови потужності і більше стали відносно невеликими, залишаючи лише квадратичну: яка саме є щільність журналу нормального розподілу.β n ( n - 2 ) / 2 α β α β n = 3αβn(n2)/2αβαβn=3

У сукупності ці форми поведінки чудово пояснюють, чому навіть для малих та неекстремальні квантиліди зразка Звичайної норми виглядають приблизно нормально.βαβ


Аналіз

Оскільки це може бути корисним для узагальнення, нехай - будь-яка функція розподілу, хоча ми маємо на увазі .F = ΦFF=Φ

Функція щільності змінної Beta за визначенням пропорційна( α , β )g(y)(α,β)

yα1(1y)β1dy.

Нехай - інтегральне перетворення ймовірності і записує для похідної , одразу ж, що має щільність, пропорційнуx f F xy=F(x)xfFx

G(x;α,β)=F(x)α1(1F(x))β1f(x)dx.

Оскільки це монотонне перетворення сильно одномодального розподілу (бета-версія), якщо є досить дивним, трансформований розподіл також буде одномодальним. Щоб вивчити, наскільки вона може бути близькою до нормальної, розглянемо логарифм її щільності,F

(1)logG(x;α,β)=(α1)logF(x)+(β1)log(1F(x))+logf(x)+C

де - невідповідна константа нормалізації.C

Розгорніть компоненти у серії Taylor, щоб упорядкувати три навколо значення (що буде близьким до режиму). Наприклад, ми можемо записати розширення якx 0 log FlogG(x;α,β)x0logF

logF(x)=c0F+c1F(xx0)+c2F(xx0)2+c3Fh3

за деякий з | ч | | x - x 0 | . Використовуйте аналогічні позначення для журналу ( 1 - F ) та журналу f . h|h||xx0|log(1F)logf

Лінійні умови

Лінійний член в тим самим стає(1)

g1(α,β)=(α1)c1F+(β1)c11F+c1f.

Коли - режим G (x0 , цей вираз дорівнює нулю. Зауважте, що оскільки коефіцієнти є неперервними функціями x 0 , оскільки α і β змінюються, режим x 0 також буде постійно змінюватися. Більше того, коли α і β є достатньо великими, термін c f 1 стає відносно невпливним. Якщо ми прагнемо вивчити межу як α і β ∞, для якої α : β залишається в постійній пропорції γG(;α,β)x0αβx0αβc1fαβ α:βγ, тому ми можемо раз і назавжди вибрати базову точку для якоїx0

γc1F+c11F=0.

Хороший випадок, коли , де α = β на всьому протязі, а F симетричний приблизно 0 . У цьому випадку очевидно , х 0 = Р ( 0 ) = 1 / 2 .γ=1α=βF0x0=F(0)=1/2

Ми домоглися методу, згідно з яким (a) в граничному значенні термін першого порядку в серії Тейлора зникає, а (b) у щойно описаному спеціальному випадку, термін першого порядку завжди дорівнює нулю.

Квадратні терміни

Це суми

g2(α,β)=(α1)c2F+(β1)c21F+c2f.

За порівнянні з нормальним розподілом, чий квадратичний член , можна оцінити , що - 1 / ( 2 г 2 ( α , β ) ) приблизно дисперсія G . Будемо стандартизувати G , змінивши розмір x за його квадратним коренем. нам насправді не потрібні деталі; достатньо зрозуміти, що цей масштаб буде множити коефіцієнт ( x(1/2)(xx0)2/σ21/(2g2(α,β))GGx в розширенні Тейлора на ( - 1 / ( 2 g 2 ( α , β ) ) ) n / 2 .(xx0)n(1/(2g2(α,β)))n/2.

Залишок терміну

Ось пункт пунктину: термін порядку в розширенні Тейлора - згідно з нашими позначеннями,n

gn(α,β)=(α1)cnF+(β1)cn1F+cnf.

Після стандартизації це стає

gn(α,β)=gn(α,β)(2g2(α,β))n/2).

Обидва є афінним поєднанням α і β . Піднімаючи знаменник до потужності n / 2 , чиста поведінка має порядок - ( n - 2 ) / 2 в кожному з α і β . Оскільки ці параметри зростають великими, то кожен додаток у розширенні Тейлора після другого зменшується до нуля асимптотично. Зокрема, термін залишку третього порядку стає довільно малим.giαβn/2(n2)/2αβ

Випадок, коли в норміF

Знищення терміну, що залишився, особливо швидко, коли є стандартним нормальним, оскільки в цьому випадку f ( x ) є чисто квадратичним: він нічого не вносить до решти. Отже, відхилення G від нормальності залежить виключно від відхилення між F α - 1 ( 1 - F ) β - 1 і нормальністю.Ff(x)GFα1(1F)β1

Це відхилення досить мале навіть для малих і β . Для ілюстрації розглянемо випадок α = β . G симетричний, від чого термін порядку 3 взагалі зникає. Залишок порядку 4 в х - х 0 = х . αβα=βG4xx0=x

Ось сюжет, що показує, як стандартизований термін четвертого порядку змінюється при малих значеннях :α>1

Figure

Значення починається з для α = β = 1 , оскільки тоді розподіл, очевидно, є нормальним ( Φ - 1, застосований до рівномірного розподілу, який є Beta ( 1 , 1 ) , дає стандартний нормальний розподіл). Хоча вона швидко зростає, вона знижується на рівні менше 0,008 - що практично не відрізняється від нуля. Після цього починається асимптотичний зворотний розпад, що робить розподіл все ближчим до нормального, оскільки α збільшується понад 2 .0α=β=1Φ1(1,1)0.008α2


2

Конвергенція

Припустимо, що і нехай α і приймає будь-який малий ε > 0 . Тоді v a r ( X ) 0 . За нерівністю Чебишева маємо Р [ | X - 0,5 | > ε ] 0 і P [ | Y | > ε ] 0 . Це означає, що Y сходиться за ймовірністю (а не за розподіломα=βαε>0var(X)0P[|X0.5|>ε]0P[|Y|>ε]0Y насправді вона сходиться в розподілі - до однотонної).

Точний розподіл

Позначимо через щільність бета-розподілу. Тоді ваша змінна Y має щільність f Y ( y ) = f X ( Φ ( y ) ) ϕ ( y ) . Оскільки Φ не має закритої форми, я вважаю, що це найдальше (аналітично). Ви можете спробувати ввести його у функцію у Wolfram Mathematica, щоб побачити, чи знайде вона кращу форму.fXY

fY(y)=fX(Φ(y))ϕ(y).
ΦFullSimplify

Ось щільність у R, так що ви можете побудувати її замість гістограми.

f_y <- function(x, alpha, beta) {
  dbeta(pnorm(x), alpha, beta) * dnorm(x)
}

Модифікація

Однак вас, можливо, цікавить розподіл . (все ще припускаючи, щоα=β) Це може бути корисно, оскількиvar(

Z=Φ1(αX)
α=β(кориснотому що він не дорівнює нулю).var(αX)1/8

1

kNk2XBeta(k,k)Y=Φ1(X)

Now let n=2k1. We start by drawing n i.i.d. uniformly distributed random variables U1,,Un. Next, form the order statistics U(1)U(n).

It is well known that U(k)Beta(k,n+1k), thus:

U(k)Beta(k,k)

In other words: The sample median of n i.i.d. uniformly distributed random variables is Beta(k,k) distributed.

Now let's transform by Zi=Φ1(Ui). Then by the probability integral transform, the Zi are i.i.d. normally distributed. Also form the order statistics of the Zi (Z(1)Z(n)). Since Φ1 is strictly increasing, it follows that:

Φ1(U(k))=Z(k)

Therefore, to show that Y is approximately normal, we just have to argue that the sample median of n i.i.d. normal random variables is approximately normal.

For k large, this can be made precise by a central limit theorem for sample medians. For k small, say k=2, I will let everyone's gut feeling do the speaking.

For ab (but not too different) one can argue similarly by using corresponding quantiles.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.