Конспект
Ви знову виявили частину побудови, описану в теоремі про центральний межа для зразків медіанів , яка ілюструє аналіз медіани вибірки. (Аналіз, очевидно, застосовується, mutatis mutandis , до будь-якого квантилу, а не лише до медіани). Тому не дивно, що для великих параметрів бета-версії (що відповідають великим вибіркам) нормальне розподіл виникає при перетворенні, описаному в питанні. Цікавить, наскільки близький до нормального розподіл навіть для малих бета-параметрів. Це заслуговує пояснення.
Я начертаю аналіз нижче. Щоб зберегти цю посаду на розумній тривалості, це передбачає безліч натякаючих руками: я прагну лише вказати на ключові ідеї. Тому дозвольте підвести підсумки тут:
Коли близьке до , все симетрично. Це призводить до того, що трансформований розподіл вже виглядає нормальним.βαβ
Функції форми в першу чергу виглядають досить нормально, навіть для малих значень і (за умови, що обидва перевищують і їх співвідношення не надто близько до або ). α β 1 0 1Φα−1(x)(1−Φ(x))β−1αβ101
Очевидна нормальність трансформованого розподілу пояснюється тим, що його щільність складається з нормальної щільності, помноженої на функцію в (2).
У міру збільшення та відхід від Нормальності може бути виміряний в решті в серії Тейлора для щільності журналу. Термін порядку зменшується пропорційно потужностям і . Це означає, що в кінцевому підсумку для досить великих та всі умови потужності і більше стали відносно невеликими, залишаючи лише квадратичну: яка саме є щільність журналу нормального розподілу.β n ( n - 2 ) / 2 α β α β n = 3αβn(n−2)/2αβαβn=3
У сукупності ці форми поведінки чудово пояснюють, чому навіть для малих та неекстремальні квантиліди зразка Звичайної норми виглядають приблизно нормально.βαβ
Аналіз
Оскільки це може бути корисним для узагальнення, нехай - будь-яка функція розподілу, хоча ми маємо на увазі .F = ΦFF=Φ
Функція щільності змінної Beta за визначенням пропорційна( α , β )g(y)(α,β)
yα−1(1−y)β−1dy.
Нехай - інтегральне перетворення ймовірності і записує для похідної , одразу ж, що має щільність, пропорційнуx f F xy=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
Оскільки це монотонне перетворення сильно одномодального розподілу (бета-версія), якщо є досить дивним, трансформований розподіл також буде одномодальним. Щоб вивчити, наскільки вона може бути близькою до нормальної, розглянемо логарифм її щільності,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
де - невідповідна константа нормалізації.C
Розгорніть компоненти у серії Taylor, щоб упорядкувати три навколо значення (що буде близьким до режиму). Наприклад, ми можемо записати розширення якx 0 log FlogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
за деякий з | ч | ≤ | x - x 0 | . Використовуйте аналогічні позначення для журналу ( 1 - F ) та журналу f . h|h|≤|x−x0|log(1−F)logf
Лінійні умови
Лінійний член в тим самим стає(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
Коли - режим G (x0 , цей вираз дорівнює нулю. Зауважте, що оскільки коефіцієнти є неперервними функціями x 0 , оскільки α і β змінюються, режим x 0 також буде постійно змінюватися. Більше того, коли α і β є достатньо великими, термін c f 1 стає відносно невпливним. Якщо ми прагнемо вивчити межу як α → ∞ і β → ∞, для якої α : β залишається в постійній пропорції γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, тому ми можемо раз і назавжди вибрати базову точку для якоїx0
γcF1+c1−F1=0.
Хороший випадок, коли , де α = β на всьому протязі, а F симетричний приблизно 0 . У цьому випадку очевидно , х 0 = Р ( 0 ) = 1 / 2 .γ=1α=βF0x0=F(0)=1/2
Ми домоглися методу, згідно з яким (a) в граничному значенні термін першого порядку в серії Тейлора зникає, а (b) у щойно описаному спеціальному випадку, термін першого порядку завжди дорівнює нулю.
Квадратні терміни
Це суми
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
За порівнянні з нормальним розподілом, чий квадратичний член , можна оцінити , що - 1 / ( 2 г 2 ( α , β ) ) приблизно дисперсія G . Будемо стандартизувати G , змінивши розмір x за його квадратним коренем. нам насправді не потрібні деталі; достатньо зрозуміти, що цей масштаб буде множити коефіцієнт ( x−(1/2)(x−x0)2/σ2−1/(2g2(α,β))GGx в розширенні Тейлора на ( - 1 / ( 2 g 2 ( α , β ) ) ) n / 2 .(x−x0)n(−1/(2g2(α,β)))n/2.
Залишок терміну
Ось пункт пунктину: термін порядку в розширенні Тейлора - згідно з нашими позначеннями,n
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
Після стандартизації це стає
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Обидва є афінним поєднанням α і β . Піднімаючи знаменник до потужності n / 2 , чиста поведінка має порядок - ( n - 2 ) / 2 в кожному з α і β . Оскільки ці параметри зростають великими, то кожен додаток у розширенні Тейлора після другого зменшується до нуля асимптотично. Зокрема, термін залишку третього порядку стає довільно малим.giαβn/2−(n−2)/2αβ
Випадок, коли в норміF
Знищення терміну, що залишився, особливо швидко, коли є стандартним нормальним, оскільки в цьому випадку f ( x ) є чисто квадратичним: він нічого не вносить до решти. Отже, відхилення G від нормальності залежить виключно від відхилення між F α - 1 ( 1 - F ) β - 1 і нормальністю.Ff(x)GFα−1(1−F)β−1
Це відхилення досить мале навіть для малих і β . Для ілюстрації розглянемо випадок α = β . G симетричний, від чого термін порядку 3 взагалі зникає. Залишок порядку 4 в х - х 0 = х . αβα=βG4x−x0=x
Ось сюжет, що показує, як стандартизований термін четвертого порядку змінюється при малих значеннях :α>1
Значення починається з для α = β = 1 , оскільки тоді розподіл, очевидно, є нормальним ( Φ - 1, застосований до рівномірного розподілу, який є Beta ( 1 , 1 ) , дає стандартний нормальний розподіл). Хоча вона швидко зростає, вона знижується на рівні менше 0,008 - що практично не відрізняється від нуля. Після цього починається асимптотичний зворотний розпад, що робить розподіл все ближчим до нормального, оскільки α збільшується понад 2 .0α=β=1Φ−1(1,1)0.008α2