Зворотна дисперсійна функція


9

Чи можна для заданого постійного числа (наприклад, 4) знайти розподіл ймовірностей для , щоб у нас було ?rXVar(X)=r


1
Ні, якщо у вас немає додаткової інформації.
Хемант Рупані

@Hemant Rupani, яка додаткова інформація потрібна?
amiref

1
будь-яка природа випадкової змінної 'X'…
Hemant Rupani

3
Я пропоную вам відредагувати своє запитання, щоб замінити "значення для X" на "розподіл для X" - якщо X має лише одне значення, то X має вироджене розподіл і матиме нульову дисперсію.
Срібна рибка

1
Якщо не негативна, відповідь, очевидно, так, дисперсією може бути будь-яке додатне число. r
dsaxton

Відповіді:


13

Уважно розглядаючи справи для r: якщо r=0 то розподіл вироджений, але X може мати будь-яке значення. Це є,Pr(X=μ)=1і для будь-якого . Таким чином, ми можемо знайти багато можливих розподілів для , але вони індексовані та повністю визначені .Pr(X=c)=0cμXμR

Якщо , розподілу не можна знайти, оскільки .r<0Var(X)=E(XμX)20

Для , то відповідь буде залежати від того, яка додаткова інформація відома про . Наприклад, якщо як відомо, має середнє значення , тоді для будь-яких і ми можемо знайти розподіл за цими моментами, взявши . Це не унікальне рішення проблеми відповідності середнього та дисперсійного, але це єдине нормально розподілене рішення (і з усіх можливих рішень це саме те, що максимізує ентропію, як вказує Даніель). Якщо ви також хотіли відповідати, наприклад, третьому центральному моменту або вище, тоді вам слід розглянути більш широкий спектр розподілу ймовірностей.r>0XXμμRr>0XN(μ,r)

Припустимо, замість цього ми мали деяку інформацію про розподіл а не про його моменти. Наприклад, якщо ми знаємо, що слідує за розподілом Пуассона, унікальним рішенням буде . Якщо ми знаємо, що слідує за експоненціальним розподілом, то знову є унікальне рішення , де ми знайшли параметр, вирішивши .XXXPoisson(r)XXExponential(1r)Var(X)=r=1λ2

В інших випадках ми можемо знайти цілу сімейство рішень. Якщо ми знаємо, що слідує за прямокутним (безперервним рівномірним) розподілом, то ми можемо знайти унікальну ширину для розподілу, вирішивши . Але буде ціле сімейство рішень, параметизовані - розподіли в цьому наборі - це всі переклади один одного. Аналогічно, якщо є нормальним, тоді буде працювати будь-який розподіл (тому у нас є цілий набір рішень, індексованих , що знову може бути будь-яким реальним числом, і знову сім'я - це всі переклади один одного). ЯкщоXwVar(X)=r=w212XU(a,a+w)aRXXN(μ,r)μX слідує за розподілом гами, тоді, використовуючи параметризацію масштабу форми, ми можемо отримати ціле сімейство рішень, параметизовані наXGamma(rθ2,θ)θ>0. Члени цієї родини не перекладають один одного. Щоб візуалізувати, як може виглядати "сімейство рішень", ось кілька прикладів нормальних розподілів, індексованихμ, а потім гамма-розподіли, індексовані θ, всі з відхиленням, рівним чотирма, що відповідає прикладу r=4 у вашому питанні.

Звичайні розподіли з відхиленням чотири Гамма-розподіли з відхиленням чотири

З іншого боку, для деяких розподілів можливо, а може і не можливо знайти рішення, залежно від значення . Наприклад, якщо має бути змінною Бернуллі, то для є два можливі рішення оскільки є дві ймовірності які вирішують рівняння , і насправді ці дві ймовірності є взаємодоповнюючими, тобто . Для існує лише унікальний розчин , а для відсутність розподілу Бернуллі не має достатньо великої дисперсії.rX0r<0.25XBernoulli(p)pVar(X)=r=p(1p)p1+p2=1r=0.25p=0.5r>0.25

Я вважаю, що слід також згадати випадок . Є рішення для цього випадку теж, наприклад Стьюдент розподілу з двома ступенями свободи.r=t

R код сюжетів

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1)) 

17

Якщо припустити, що ви маєте на увазі "чи можна знайти розподіл ймовірності дляX"тоді відповідь" так ", оскільки ви не вказали жодних критеріїв, які Xповинні задовольняти. Насправді існує нескінченна кількість можливих розподілів, які б задовольнили цю умову. Просто врахуйте нормальний розподіл,N(x;μ,σ2). Ви можете встановитиσ2=r і μ Ви можете прийняти будь-яке значення, яке вам подобається - тоді ви матимете Var[X]=r по мірі необхідності.

Насправді нормальний розподіл є досить особливим у цьому плані, оскільки це максимальний розподіл ймовірності ентропії для заданого середнього та дисперсії.


ти маєш рацію, я виправив це. чи поясніть, будь ласка, більше?
amiref

@AmirEf Що незрозуміло?
Даніель

6
Зовсім не зрозуміло, що ще повинен пояснити Даніель; відповідь тут, здається, стосується всього, що у вашому розміщеному запитанні.
Glen_b -Встановити Моніку

15

Це питання можна інтерпретувати так, що робить його цікавим та не зовсім тривіальним. Дав щосьХщо виглядає як випадкова величина, наскільки можливо присвоїти ймовірності своїм значенням (або змістити існуючі ймовірності навколо) таким чином, щоб її дисперсія дорівнювала деякому попередньо визначеному числуr? Відповідь полягає в тому, що всі можливі значенняr0 допустимі до межі, визначеної діапазоном Х.

Потенційний інтерес до такого аналізу полягає в ідеї зміни міри ймовірності, зберігаючи фіксовану випадкову змінну, щоб досягти певної мети. Хоча ця програма проста, вона відображає деякі ідеї, що лежать в основі теореми Гірсанова , основоположного в математичному фінансі .


Повторимо це питання строго, однозначно. Припустимо

Х:(Ω,S)R

є вимірюваною функцією, визначеною на просторі вимірювання Ω з сигма-алгеброю S. Для заданого реального числаr>0, коли можливо знайти міру ймовірності П на цьому просторі, для якого Вар(Х)=r?

Я вважаю, що відповідь полягає в тому, що це можливо, колисуп(Х)-інф(Х)>2r. (Рівність може бути дотримана, якщо досягнуті обидва вище і найвищого рівня: тобто вони фактично є максимумом і мінімумомХ.) Коли будь-який суп(Х)= або інф(Х)=-ця умова не обмежує r, і тоді можливі всі негативні значення дисперсії.

Доказ - це конструкція. Почнемо з простої його версії, подбати про деталі та закріпити основну ідею, а потім перейти до власне побудови.

  1. Дозволяє х бути в образі Х: це означає, що є ωхΩ для котрого Х(ωх)=х. Визначте задану функціюP:S[0,1] бути показником ωx: це є, P(A)=0 якщо ωxA і P(A)=1 коли ωxA.

    З тих пір P(Ω)=1, очевидно Pзадовольняє перші дві аксіоми ймовірності . Треба показати, що вона задовольняє третю; а саме, що це сигма-добавка. Але це майже так само очевидно: щоразу{Ei,i=1,2,} є кінцевою або незліченною нескінченною сукупністю взаємовиключних подій, то жодна з них не містить ωx--У якому випадку P(Ei)=0 для усіх i- або саме один з них містить ωx, У якому випадку P(Ej)=1 для якогось конкретного j інакше P(Ei)=0 для усіх ij. В будь-якому випадку

    P(iEi)=iP(Ei)

    тому що обидві сторони або обидві 0 або обидва 1.

    З тих пір P концентрує всю ймовірність на ωx, розповсюдження X зосереджена на x і X повинна мати нульову дисперсію.

  2. Дозволяє x1x2 бути двома значеннями в діапазоні X; це є,X(ω1)=x1 і X(ω2)=x2. У спосіб, аналогічний попередньому кроку, визначте міруP бути середньозваженим показником показників ω1 і ω2. Використовуйте негативні ваги1p і p для pбути визначеним. Як і раніше, ми знаходимо цеP- будучи опуклою комбінацією показникових показників, обговорених у (1) - є мірою ймовірності. РозподілX стосовно цього заходу є Бернуллі(p) розповсюдження, яке масштабується x2x1 і зміщений на x1. Бо дисперсія Бернуллі(p) поширення є p(1p), дисперсія X повинно бути (x2x1)2p(1p).

Безпосереднім наслідком (2) є те, що будь-який r для яких існують x1x2 в діапазоні X і 0p<1 для котрого

r=(x2x1)2p(1p)

може бути дисперсією X. З тих пір0p(1p)1/4, це означає

2r=4rrp(1p)=(x2x1)2=x2x1sup(X)inf(X),

при рівності, якщо і тільки якщо X має максимум і мінімум.

І навпаки, якщо r перевищує цю межу (sup(X)inf(X))2/4, тоді рішення неможливо, оскільки ми вже знаємо, що дисперсія будь-якої обмеженої випадкової величини не може перевищувати чверті квадрата її діапазону.


3
Чувак, я думаю, ти на зовсім іншому рівні, ніж ОП.
Марк Л. Стоун

4
@Mark Напевно. (Я думаю, ви тут виявили потік дуже сухого гумору.) Але кожен, хто застосовує тег математичної статистики до своєї посади, повинен очікувати такого роду :-).
whuber

2
Це щось нагадує мені, коли я брав 4-х учнівський клас у покійного професора Семюеля Карліна (про Карлін та Тейлор слави серед інших) на "Загальна позитивність". Тема теорії ігор якось виникла. Він сказав, о, теорія ігор. У вас є два негативні сигма-обмежувальні заходи ...., тепер уявіть, як він вводить цю теорію ігор таким чином для студентів на першокласному курсі економіки в ліберальному коледжі мистецтв. Ось про що я згадав ваш пост.
Марк Л. Стоун

@ Марк зрозумів. Не можна було б цього зробити і досягти успіху. Як ви зазначаєте, я пишу тут для (підмножини) загальних читачів, а не для конкретного. З іншого боку, абстрактний предмет не є складним (на цьому елементарному рівні) і виявився доступним мотивованим неклассникам у коледжах з вільних мистецтв. Дивіться, наприклад, коментарі на сайті stats.stackexchange.com/a/94876 .
whuber

4
@ MarkL.Stone відповіді - це більше, ніж просто безпосередній запитувач (SE призначений бути сховищем гарних запитань та гарних відповідей, цінних для пізніх людей з подібними питаннями), і ми вже маємо відповіді на більш елементарний погляд на питання тут. . Деякі інші читачі можуть отримати щось із менш елементарного сприйняття речей, тому різноманітність стилів та рівнів відповідей робить питання корисним для більшості людей.
Glen_b -Встановіть Моніку

10

Так, таке розподіл можна знайти. Насправді ви можете взяти будь-який розподіл із кінцевою дисперсією та масштабом, щоб відповідати вашим умовам, оскільки

Var[cX]=c2Var[X]

Наприклад, рівномірний розподіл на інтервал[0,1] має дисперсію:

σ2=112
Отже, рівномірний розподіл в інтервалі [0,112r] буде мати дисперсію r.

Насправді це звичайний спосіб додавання параметрів до деяких розподілів, наприклад, Student t. Він має лише один параметр,ν- ступеня свободи. Колиνрозподіл переходить до стандартного нормального. Він має дзвіночну форму і дуже схожий на звичайний, але має жирніші хвости. Ось чому його часто використовують як альтернативу нормальному розподілу, коли хвости жирні. Єдина проблема полягає в тому, що розподіл Гаусса має два параметри. Отже, виходить масштабована версія розповсюдження Student t, яку іноді називають " t шкалою розташування" . Це дуже просте перетворення:ξ=tμs, де μ,s- розташування та масштаб. Тепер ви можете встановити масштаб так, щоб нова зміннаξ матиме будь-яку необхідну дисперсію та матиме форму розподілу Student t.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.