Прелімінарії
Пишіть
Ip(ϵ)=∫∞0p(x)log(p(x)(1+ϵ)p(x(1+ϵ)))dx.
Логарифми та зв'язок між та пропонують виразити як і його аргумент як експоненти. З цією метою визначтеp(x)p(x(1+ϵ))p
q(y)=log(p(ey))
для всіх реальних для яких права сторона визначена і дорівнює де . Зауважте, що зміна змінних тягне за собою і (приймаючи за щільність розподілу), що закон сумарної ймовірності може бути виражений таким чиномy−∞p(ey)=0x=eydx=eydyp
1=∫∞0p(x)dx=∫Req(y)+ydy.(1)
Припустимо, що коли . eq(y)+y→0y→±∞ Це виключає розподіл ймовірностей з нескінченно великими шипами щільності близько або . Зокрема, якщо хвости зрештою є монотонними, випливає це припущення, показуючи, що воно не є суворим.p0∞p(1)
Щоб полегшити роботу з логарифмами, також це дотримуйтесь
1+ϵ=eϵ+O(ϵ2).
Оскільки наступні обчислення будуть виконані до кратних , визначтеϵ2
δ=log(1+ϵ).
Ми також можемо замінити на , при цьому відповідає а позитивний відповідає позитивному .1+ϵeδδ=0ϵ=0δϵ
Аналіз
Одним із очевидних способів нерівності може бути невдача - це інтеграл розходитись для деякого . Це станеться, якби, наприклад, мали бути будь-який власний інтервал додатних чисел, незалежно від того, наскільки малий, у якому були однаково нульовими, але не були нульовими на інтервалі . Це призведе до того, що інтеград буде нескінченна з позитивною ймовірністю.Ip(ϵ)ϵ∈(0,1][u,v]pp[u−ϵ,v−ϵ]
Оскільки питання не є специфічним щодо природи , ми можемо заплутатися в технічних питаннях щодо того, наскільки гладким може бути . Давайте уникатимемо таких питань, все ще сподіваючись отримати деяке розуміння, припускаючи, що скрізь має стільки похідних, як ми могли б хотіти використовувати. (Двох буде достатньо, якщо безперервний.) Оскільки це гарантії залишається обмеженим у будь-якому обмеженому множині, це означає, що ніколи не дорівнює нулю, коли .ppqq′′qp(x)x>0
Зауважте, що питання дійсно стосується поведінки коли наближається до нуля зверху. Оскільки цей інтеграл є неперервною функцією в інтервалі , він досягає деякого максимуму коли обмежений будь-яким позитивним інтервалом , що дозволяє нам вибрати , тому що очевидноIp(ϵ)ϵϵ(0,1]Mp(a)ϵ[a,1]c=Mp(a)/a2
cϵ2=Mp(a)(ϵa)2≥Mp(a)≥Ip(ϵ)
змушує нерівність працювати. Ось чому нам потрібно займатися лише модулем обчислення .ϵ2
Рішення
Використовуючи зміни змінної від до , від до та до , давайте обчислимо через другий порядок у (або ) у надії досягти спрощення. Для цього визначтеxypqϵδIp(ϵ)ϵδ
R(y,δ)δ2=q(y+δ)−q(y)−δq′(y)
бути залишком порядку в розширенні Тейлора навколо .2qy
Ip(ϵ)=∫Req(y)+y(q(y)−q(y+δ)−δ)dy=−∫Req(y)+y(δ+δq′(y)+R(y,δ)δ2)dy=−δ∫Req(y)+y(1+q′(y))dy−δ2∫Req(y)+yR(y,δ)dy.
Зміна змінних на в лівій інтегралі показує, що вона повинна зникати, як це зазначалося в припущенні, що випливає з . Зміна змінних назад на в правій інтегралі даєq(y)+y(1)x=ey
Ip(ϵ)=−δ2∫Rp(x)R(log(x),δ)dy=−δ2Ep(R(log(x),δ)).
Нерівність дотримується (за нашими різними технічними припущеннями) тоді і лише тоді, коли коефіцієнт праворуч кінцевий.δ2
Інтерпретація
Це хороший момент, щоб зупинитись, оскільки він, як видається, розкриває істотну проблему: обмежується квадратичною функцією саме тоді, коли квадратична помилка в розширенні Тейлора не відповідає вибухають (щодо розподілу) , як наближається .Ip(ϵ)ϵqy±∞
Давайте перевіримо деякі випадки, згадані у питанні: Експоненціальні та гамма-розподіли. (Експоненція - це особливий випадок Гамми.) Нам ніколи не потрібно турбуватися про параметри шкали, оскільки вони просто змінюють одиниці вимірювання. Мають значення лише немасштабні параметри.
Тут, тому що для , Розширення Тейлора навколо довільного - цеЗ теореми Тейлора з залишком випливає, що переважає для досить малого . Оскільки очікування є скінченним, для розподілів Gamma існує нерівність.p(x)=xke−xk>−1
q(y)=−ey+ky−logΓ(k+1).
yConstant+(k−ey)δ−ey2δ2+⋯.
R(log(x),δ)ey+δ/2<xδx
Подібні обчислення передбачають нерівність розподілів Вейбулла, напівнормальних розподілів, лонормальних розподілів тощо. Насправді, для отримання контрприкладів нам потрібно було б порушити хоча б одне припущення, змусивши нас подивитися на розподіли, де зникає на певному інтервалі, або не безперервно двічі диференціюється, або має нескінченно багато режимів. Це прості тести, які можна застосувати до будь-якого сімейства розподілів, які зазвичай використовуються в статистичному моделюванні.p