Спеціальний розподіл ймовірностей


12

Якщо - розподіл ймовірності з ненульовими значеннями на , для якого типу (s) існує константа така, що для всіх ?p(x)[0,+)p(x)c>00p(x)logp(x)(1+ϵ)p(x(1+ϵ))dxcϵ20<ϵ<1

Нерівність, наведена вище, насправді є дивергенцією Кулбека-Лейблера між розподілом та стислим його варіантом . Я з’ясував, що ця нерівність стосується розподілів експоненціальної, гамма та вейбулла, і мені цікаво знати, чи працює це для більшого класу розподілів ймовірностей.p(x)(1+ϵ)p(x(1+ϵ))

Будь-яка ідея, що ця нерівність означає?


3
Оскільки ϵ позитивний, він би стискався (у напрямку x), а не розтягувався.
Glen_b -Встановіть Моніку

2
Це питання неоднозначне: які ваші квантори? Ви хочете, щоб ця нерівність дотримувалася для всіх , принаймні одного чи чогось іншого? Є урахуванням апріорної або ви маєте в виду повинно існувати хоча б одне таке значення в ? А оскільки ви згадуєте класи розподілу ймовірностей, під " " ви маєте на увазі одне конкретне розподіл чи ви, мабуть, маєте на увазі параметричне їх сімейство? ϵ c c p ( x )ϵ ϵccp(x)
whuber

2
@whuber Дякуємо за ваші коментарі. Я виправив свою заяву про проблему, щоб уточнити вказані проблеми. Я маю на увазі, для чого виконується наведена нерівність? Відповідь може бути або введенням параметричного сімейства розподілів, або пропонуванням диференціального рівняння для яке достатньо і дає бажану нерівність. p ( x )p(x)p(x)
Sus20200

2
Невже ця нерівність не спрацює для будь-якого p (x), який є безперервним і з нескінченною підтримкою? Ви обчислюєте розбіжність KL всередині параметричного сімейства ( . Якщо KL є значущим на 0, то його похідна дорівнює 0. Приймаючи як максимум кривизни KL (для ) ми пов'язані. Додатковою роботою може бути можливо зв’язати C з властивостями pC ϵ [ 0 , 1 ]ϵp(x(1+ϵ))Cϵ[0,1]
Гійом Дегаен

1
Це може бути нескінченність, поки . Розширення KL першого порядку -L=limx0p(x)x=0Lϵ+O(ϵ2)
Артур Б.

Відповіді:


4

Прелімінарії

Пишіть

Ip(ϵ)=0p(x)log(p(x)(1+ϵ)p(x(1+ϵ)))dx.

Логарифми та зв'язок між та пропонують виразити як і його аргумент як експоненти. З цією метою визначтеp(x)p(x(1+ϵ))p

q(y)=log(p(ey))

для всіх реальних для яких права сторона визначена і дорівнює де . Зауважте, що зміна змінних тягне за собою і (приймаючи за щільність розподілу), що закон сумарної ймовірності може бути виражений таким чиномyp(ey)=0x=eydx=eydyp

(1)1=0p(x)dx=Req(y)+ydy.

Припустимо, що коли . eq(y)+y0y± Це виключає розподіл ймовірностей з нескінченно великими шипами щільності близько або . Зокрема, якщо хвости зрештою є монотонними, випливає це припущення, показуючи, що воно не є суворим.p0p(1)

Щоб полегшити роботу з логарифмами, також це дотримуйтесь

1+ϵ=eϵ+O(ϵ2).

Оскільки наступні обчислення будуть виконані до кратних , визначтеϵ2

δ=log(1+ϵ).

Ми також можемо замінити на , при цьому відповідає а позитивний відповідає позитивному .1+ϵeδδ=0ϵ=0δϵ

Аналіз

Одним із очевидних способів нерівності може бути невдача - це інтеграл розходитись для деякого . Це станеться, якби, наприклад, мали бути будь-який власний інтервал додатних чисел, незалежно від того, наскільки малий, у якому були однаково нульовими, але не були нульовими на інтервалі . Це призведе до того, що інтеград буде нескінченна з позитивною ймовірністю.Ip(ϵ)ϵ(0,1][u,v]pp[uϵ,vϵ]

Оскільки питання не є специфічним щодо природи , ми можемо заплутатися в технічних питаннях щодо того, наскільки гладким може бути . Давайте уникатимемо таких питань, все ще сподіваючись отримати деяке розуміння, припускаючи, що скрізь має стільки похідних, як ми могли б хотіти використовувати. (Двох буде достатньо, якщо безперервний.) Оскільки це гарантії залишається обмеженим у будь-якому обмеженому множині, це означає, що ніколи не дорівнює нулю, коли .ppqqqp(x)x>0

Зауважте, що питання дійсно стосується поведінки коли наближається до нуля зверху. Оскільки цей інтеграл є неперервною функцією в інтервалі , він досягає деякого максимуму коли обмежений будь-яким позитивним інтервалом , що дозволяє нам вибрати , тому що очевидноIp(ϵ)ϵϵ(0,1]Mp(a)ϵ[a,1]c=Mp(a)/a2

cϵ2=Mp(a)(ϵa)2Mp(a)Ip(ϵ)

змушує нерівність працювати. Ось чому нам потрібно займатися лише модулем обчислення .ϵ2

Рішення

Використовуючи зміни змінної від до , від до та до , давайте обчислимо через другий порядок у (або ) у надії досягти спрощення. Для цього визначтеxypqϵδIp(ϵ)ϵδ

R(y,δ)δ2=q(y+δ)q(y)δq(y)

бути залишком порядку в розширенні Тейлора навколо .2qy

Ip(ϵ)=Req(y)+y(q(y)q(y+δ)δ)dy=Req(y)+y(δ+δq(y)+R(y,δ)δ2)dy=δReq(y)+y(1+q(y))dyδ2Req(y)+yR(y,δ)dy.

Зміна змінних на в лівій інтегралі показує, що вона повинна зникати, як це зазначалося в припущенні, що випливає з . Зміна змінних назад на в правій інтегралі даєq(y)+y(1)x=ey

Ip(ϵ)=δ2Rp(x)R(log(x),δ)dy=δ2Ep(R(log(x),δ)).

Нерівність дотримується (за нашими різними технічними припущеннями) тоді і лише тоді, коли коефіцієнт праворуч кінцевий.δ2

Інтерпретація

Це хороший момент, щоб зупинитись, оскільки він, як видається, розкриває істотну проблему: обмежується квадратичною функцією саме тоді, коли квадратична помилка в розширенні Тейлора не відповідає вибухають (щодо розподілу) , як наближається .Ip(ϵ)ϵqy±

Давайте перевіримо деякі випадки, згадані у питанні: Експоненціальні та гамма-розподіли. (Експоненція - це особливий випадок Гамми.) Нам ніколи не потрібно турбуватися про параметри шкали, оскільки вони просто змінюють одиниці вимірювання. Мають значення лише немасштабні параметри.

Тут, тому що для , Розширення Тейлора навколо довільного - цеЗ теореми Тейлора з залишком випливає, що переважає для досить малого . Оскільки очікування є скінченним, для розподілів Gamma існує нерівність.p(x)=xkexk>1

q(y)=ey+kylogΓ(k+1).
y
Constant+(key)δey2δ2+.
R(log(x),δ)ey+δ/2<xδx

Подібні обчислення передбачають нерівність розподілів Вейбулла, напівнормальних розподілів, лонормальних розподілів тощо. Насправді, для отримання контрприкладів нам потрібно було б порушити хоча б одне припущення, змусивши нас подивитися на розподіли, де зникає на певному інтервалі, або не безперервно двічі диференціюється, або має нескінченно багато режимів. Це прості тести, які можна застосувати до будь-якого сімейства розподілів, які зазвичай використовуються в статистичному моделюванні.p

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.