Відмова: Я ніколи раніше не працював з цим розповсюдженням. Ця відповідь ґрунтується на цій статті у вікіпедії та моїй інтерпретації.
Розподіл Діріхле - це багатофакторний розподіл ймовірностей із властивостями, подібними до розподілу Бета.
PDF визначається наступним чином:
{x1,…,xK}∼1B(α)∏i=1Kxαi−1i
з , та .K≥2xi∈(0,1)∑Ki=1xi=1
Якщо ми подивимось на тісно пов’язаний бета-розподіл:
{x1,x2(=1−x1)}∼1B(α,β)xα−11xβ−12
ми можемо бачити, що ці два розподіли однакові, якщо . Тож спершу грунтуємося на цій інтерпретації, а потім узагальнюємо до .K=2K>2
У статистиці Баєса Бета-розподіл використовується як кон'югат, попередній для біноміальних параметрів (Див. Розподіл бета ). Попередній може бути визначений як попередні знання про та (або відповідно до розподілу Діріхле та ). Якщо якісь - то біноміальні проби , тобто успіхи і невдача, заднє розподіл потім наступний чином : і . (Я не буду це робити, оскільки це, мабуть, одне з перших речей, які ви дізнаєтесь із байєсівської статистики).β α 1 α 2 A B α 1 , p o s = α 1 + A α 2 , p o s = α 2 + Bαβα1α2ABα1,pos=α1+Aα2,pos=α2+B
Отже, розподіл Beta представляє деякий задній розподіл на та , який можна інтерпретувати як ймовірність успіхів і невдач відповідно у двочленному розподілі. І чим більше у вас даних ( і ), тим вузькішим буде цей задній розподіл.x 2 ( = 1 - x 1 ) A Bx1x2(=1−x1)AB
Тепер ми знаємо, як працює розподіл для , ми можемо узагальнити його для роботи для багаточленного розподілу замість двочленного. Що означає, що замість двох можливих результатів (успіх чи невдача) ми дозволимо отримати результати (див., Чому він узагальнює Beta / Binom, якщо ?) Кожен з цих результатів матиме ймовірність , яка дорівнює 1, як це можливо.K K = 2 K x iK=2KK=2Kxi
α 1 α 2 x iαiТоді виконує аналогічну роль як та в дистрибутиві Beta, як попереднє для і оновлюється аналогічно.α1α2xi
Тож тепер, щоб перейти до ваших питань:
Як alphas
впливають на розподіл?
Розподіл обмежується обмеженнями та . визначити , які частини - мірного простору отримати максимальну масу. Ви можете бачити це на цьому зображенні (не вкладаючи його сюди, тому що я не є власником зображення). Чим більше даних у задній частині (використовуючи цю інтерпретацію), тим вище , тим більш впевненим ви є значення або ймовірності для кожного з результатів. Це означає, що щільність буде більш концентрованою.xi∈(0,1)∑Ki=1xi=1αiK∑Ki=1αixi
Як alphas
нормалізуються істоти?
Нормалізація розподілу (переконавшись, що інтеграл дорівнює 1) проходить через термін :B(α)
B(α)=∏Ki=1Γ(αi)Γ(∑Ki=1αi)
Знову ж таки, якщо ми подивимось на випадок ми можемо побачити, що нормалізуючий коефіцієнт такий же, як у бета-розподілі, який використовував наступне:K=2
B(α1,α2)=Γ(α1)Γ(α2)Γ(α1+α2)
Це поширюється на
B(α)=Γ(α1)Γ(α2)…Γ(αK)Γ(α1+α2+⋯+αK)
Що відбувається, коли альфа не є цілими числами?
Інтерпретація не змінюється для , але, як ви бачите на зображенні, яке я зв'язав раніше , якщо маса розподілу накопичується в краях діапазону для . з іншого боку, має бути цілим числом і .α i < 1 x i K K ≥ 2αi>1αi<1xiKK≥2