Зворотна дисперсійна функція

9

Чи можна для заданого постійного числа (наприклад, 4) знайти розподіл ймовірностей для , щоб у нас було ? $r$ $X$ $\mathrm{Var}(X)=r$

distributions mathematical-statistics variance

— amiref
джерело

1

Ні, якщо у вас немає додаткової інформації.

— Хемант Рупані

@Hemant Rupani, яка додаткова інформація потрібна?

— amiref

1

будь-яка природа випадкової змінної 'X'…

— Hemant Rupani

3

Я пропоную вам відредагувати своє запитання, щоб замінити "значення для X" на "розподіл для X" - якщо X має лише одне значення, то X має вироджене розподіл і матиме нульову дисперсію.

— Срібна рибка

1

Якщо не негативна, відповідь, очевидно, так, дисперсією може бути будь-яке додатне число.

r

$r$

— dsaxton

13

Уважно розглядаючи справи для $r$ : якщо $r=0$ то розподіл вироджений, але $X$ може мати будь-яке значення. Це є, $\Pr(X=\mu)=1$ і для будь-якого . Таким чином, ми можемо знайти багато можливих розподілів для , але вони індексовані та повністю визначені . $\Pr(X=c)=0$ $c \neq \mu$ $X$ $\mu \in \mathbb{R}$

Якщо , розподілу не можна знайти, оскільки . $r<0$ $\mathrm{Var}(X)=\mathbb{E}(X-\mu_X)^2 \geq 0$

Для , то відповідь буде залежати від того, яка додаткова інформація відома про . Наприклад, якщо як відомо, має середнє значення , тоді для будь-яких і ми можемо знайти розподіл за цими моментами, взявши . Це не унікальне рішення проблеми відповідності середнього та дисперсійного, але це єдине нормально розподілене рішення (і з усіх можливих рішень це саме те, що максимізує ентропію, як вказує Даніель). Якщо ви також хотіли відповідати, наприклад, третьому центральному моменту або вище, тоді вам слід розглянути більш широкий спектр розподілу ймовірностей. $r>0$ $X$ $X$ $\mu$ $\mu \in \mathbb{R}$ $r>0$ $X \sim N(\mu, r)$

Припустимо, замість цього ми мали деяку інформацію про розподіл а не про його моменти. Наприклад, якщо ми знаємо, що слідує за розподілом Пуассона, унікальним рішенням буде . Якщо ми знаємо, що слідує за експоненціальним розподілом, то знову є унікальне рішення , де ми знайшли параметр, вирішивши . $X$ $X$ $X \sim \mathrm{Poisson}(r)$ $X$ $X \sim \mathrm{Exponential}(\frac{1}{\sqrt{r}})$ $\mathrm{Var}(X) = r = \frac{1}{\lambda^2}$

В інших випадках ми можемо знайти цілу сімейство рішень. Якщо ми знаємо, що слідує за прямокутним (безперервним рівномірним) розподілом, то ми можемо знайти унікальну ширину для розподілу, вирішивши . Але буде ціле сімейство рішень, параметизовані - розподіли в цьому наборі - це всі переклади один одного. Аналогічно, якщо є нормальним, тоді буде працювати будь-який розподіл (тому у нас є цілий набір рішень, індексованих , що знову може бути будь-яким реальним числом, і знову сім'я - це всі переклади один одного). Якщо $X$ $w$ $\mathrm{Var}(X) = r = \frac{w^2}{12}$ $X \sim U(a, a+w)$ $a \in \mathbb{R}$ $X$ $X \sim N(\mu, r)$ $\mu$ $X$ слідує за розподілом гами, тоді, використовуючи параметризацію масштабу форми, ми можемо отримати ціле сімейство рішень, параметизовані на $X \sim \mathrm{Gamma}(\frac{r}{\theta^2}, \theta)$ $\theta > 0$ . Члени цієї родини не перекладають один одного. Щоб візуалізувати, як може виглядати "сімейство рішень", ось кілька прикладів нормальних розподілів, індексованих $\mu$ , а потім гамма-розподіли, індексовані $\theta$ , всі з відхиленням, рівним чотирма, що відповідає прикладу $r=4$ у вашому питанні.

Звичайні розподіли з відхиленням чотири Гамма-розподіли з відхиленням чотири

З іншого боку, для деяких розподілів можливо, а може і не можливо знайти рішення, залежно від значення . Наприклад, якщо має бути змінною Бернуллі, то для є два можливі рішення оскільки є дві ймовірності які вирішують рівняння , і насправді ці дві ймовірності є взаємодоповнюючими, тобто . Для існує лише унікальний розчин , а для відсутність розподілу Бернуллі не має достатньо великої дисперсії. $r$ $X$ $0 \leq r \lt 0.25$ $X \sim \mathrm{Bernoulli}(p)$ $p$ $\mathrm{Var}(X) = r = p(1-p)$ $p_1 + p_2 = 1$ $r=0.25$ $p=0.5$ $r>0.25$

Я вважаю, що слід також згадати випадок . Є рішення для цього випадку теж, наприклад Стьюдент розподілу з двома ступенями свободи. $r = \infty$ $t$

R код сюжетів

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1))

— Срібна рибка
джерело

17

Якщо припустити, що ви маєте на увазі "чи можна знайти розподіл ймовірності для $X$ "тоді відповідь" так ", оскільки ви не вказали жодних критеріїв, які $X$ повинні задовольняти. Насправді існує нескінченна кількість можливих розподілів, які б задовольнили цю умову. Просто врахуйте нормальний розподіл, $\mathcal{N}(x ; \mu, \sigma^2)$ . Ви можете встановити $\sigma^2 = r$ і $\mu$ Ви можете прийняти будь-яке значення, яке вам подобається - тоді ви матимете $Var[X] = r$ по мірі необхідності.

Насправді нормальний розподіл є досить особливим у цьому плані, оскільки це максимальний розподіл ймовірності ентропії для заданого середнього та дисперсії.

— Даніель
джерело

ти маєш рацію, я виправив це. чи поясніть, будь ласка, більше?

— amiref

@AmirEf Що незрозуміло?

— Даніель

6

Зовсім не зрозуміло, що ще повинен пояснити Даніель; відповідь тут, здається, стосується всього, що у вашому розміщеному запитанні.

— Glen_b -Встановити Моніку

15

Це питання можна інтерпретувати так, що робить його цікавим та не зовсім тривіальним. Дав щось $X$ що виглядає як випадкова величина, наскільки можливо присвоїти ймовірності своїм значенням (або змістити існуючі ймовірності навколо) таким чином, щоб її дисперсія дорівнювала деякому попередньо визначеному числу $r$ ? Відповідь полягає в тому, що всі можливі значення $r\ge 0$ допустимі до межі, визначеної діапазоном $X$ .

Потенційний інтерес до такого аналізу полягає в ідеї зміни міри ймовірності, зберігаючи фіксовану випадкову змінну, щоб досягти певної мети. Хоча ця програма проста, вона відображає деякі ідеї, що лежать в основі теореми Гірсанова , основоположного в математичному фінансі .

Повторимо це питання строго, однозначно. Припустимо

Х : (Ω, S) \to R

$X:(\Omega, \mathfrak{S}) \to \mathbb{R}$

є вимірюваною функцією, визначеною на просторі вимірювання $\Omega$ з сигма-алгеброю $\mathfrak{S}$ . Для заданого реального числа $r \gt 0$ , коли можливо знайти міру ймовірності $\mathbb{P}$ на цьому просторі, для якого $\text{Var}(X) = r$ ?

Я вважаю, що відповідь полягає в тому, що це можливо, коли $\sup(X) - \inf(X) \gt 2\sqrt{r}$ . (Рівність може бути дотримана, якщо досягнуті обидва вище і найвищого рівня: тобто вони фактично є максимумом і мінімумом $X$ .) Коли будь-який $\sup(X)=\infty$ або $\inf(X)=-\infty$ ця умова не обмежує $r$ , і тоді можливі всі негативні значення дисперсії.

Доказ - це конструкція. Почнемо з простої його версії, подбати про деталі та закріпити основну ідею, а потім перейти до власне побудови.

Дозволяє $x$ бути в образі $X$ : це означає, що є $\omega_x\in\Omega$ для котрого $X(\omega_x) = x$ . Визначте задану функцію $\mathbb{P}:\mathfrak{S}\to [0,1]$ бути показником $\omega_x$ : це є, $\mathbb{P}(A) = 0$ якщо $\omega_x\notin A$ і $\mathbb{P}(A) = 1$ коли $\omega_x\in A$ .

З тих пір $\mathbb{P}(\Omega)=1$ , очевидно $\mathbb P$ задовольняє перші дві аксіоми ймовірності . Треба показати, що вона задовольняє третю; а саме, що це сигма-добавка. Але це майже так само очевидно: щоразу $\{E_i, i=1, 2, \ldots\}$ є кінцевою або незліченною нескінченною сукупністю взаємовиключних подій, то жодна з них не містить $\omega_x$ --У якому випадку $\mathbb{P}(E_i)=0$ для усіх $i$ - або саме один з них містить $\omega_x$ , У якому випадку $\mathbb{P}(E_j)=1$ для якогось конкретного $j$ інакше $\mathbb{P}(E_i)=0$ для усіх $i\ne j$ . В будь-якому випадку

$P (\cup_{i} E_{i}) = \sum_{i} P (E_{i})$ $\mathbb{P}\left(\cup_i E_i\right) = \sum_i \mathbb{P}(E_i)$
тому що обидві сторони або обидві $0$ або обидва $1$ .

З тих пір $\mathbb{P}$ концентрує всю ймовірність на $\omega_x$ , розповсюдження $X$ зосереджена на $x$ і $X$ повинна мати нульову дисперсію.
Дозволяє $x_1 \le x_2$ бути двома значеннями в діапазоні $X$ ; це є, $X(\omega_1) = x_1$ і $X(\omega_2) = x_2$ . У спосіб, аналогічний попередньому кроку, визначте міру $\mathbb{P}$ бути середньозваженим показником показників $\omega_1$ і $\omega_2$ . Використовуйте негативні ваги $1-p$ і $p$ для $p$ бути визначеним. Як і раніше, ми знаходимо це $\mathbb{P}$ - будучи опуклою комбінацією показникових показників, обговорених у (1) - є мірою ймовірності. Розподіл $X$ стосовно цього заходу є Бернуллі $(p)$ розповсюдження, яке масштабується $x_2-x_1$ і зміщений на $-x_1$ . Бо дисперсія Бернуллі $(p)$ поширення є $p(1-p)$ , дисперсія $X$ повинно бути $(x_2-x_1)^2p(1-p)$ .

Безпосереднім наслідком (2) є те, що будь-який $r$ для яких існують $x_1 \le x_2$ в діапазоні $X$ і $0 \le p \lt 1$ для котрого

r = (x_{2} - x_{1})^{2} p (1 - p)

$r = (x_2-x_1)^2p(1-p)$

може бути дисперсією $X$ . З тих пір $0 \le p(1-p) \le 1/4$ , це означає

2 \sqrt{r} = \sqrt{4 r} \leq \sqrt{\frac{r}{p (1 - p)}} = \sqrt{(x_{2} - x_{1})^{2}} = x_{2} - x_{1} \leq sup (X) - inf (X),

$2\sqrt{r} = \sqrt{4 r} \le \sqrt{\frac{r}{p(1-p)}} = \sqrt{(x_2-x_1)^2} = x_2-x_1 \le \sup(X)-\inf(X),$

при рівності, якщо і тільки якщо $X$ має максимум і мінімум.

І навпаки, якщо $r$ перевищує цю межу $(\sup(X)-\inf(X))^2/4$ , тоді рішення неможливо, оскільки ми вже знаємо, що дисперсія будь-якої обмеженої випадкової величини не може перевищувати чверті квадрата її діапазону.

— дзижчати
джерело

3

Чувак, я думаю, ти на зовсім іншому рівні, ніж ОП.

— Марк Л. Стоун

4

@Mark Напевно. (Я думаю, ви тут виявили потік дуже сухого гумору.) Але кожен, хто застосовує тег математичної статистики до своєї посади, повинен очікувати такого роду :-).

— whuber

2

Це щось нагадує мені, коли я брав 4-х учнівський клас у покійного професора Семюеля Карліна (про Карлін та Тейлор слави серед інших) на "Загальна позитивність". Тема теорії ігор якось виникла. Він сказав, о, теорія ігор. У вас є два негативні сигма-обмежувальні заходи ...., тепер уявіть, як він вводить цю теорію ігор таким чином для студентів на першокласному курсі економіки в ліберальному коледжі мистецтв. Ось про що я згадав ваш пост.

— Марк Л. Стоун

@ Марк зрозумів. Не можна було б цього зробити і досягти успіху. Як ви зазначаєте, я пишу тут для (підмножини) загальних читачів, а не для конкретного. З іншого боку, абстрактний предмет не є складним (на цьому елементарному рівні) і виявився доступним мотивованим неклассникам у коледжах з вільних мистецтв. Дивіться, наприклад, коментарі на сайті stats.stackexchange.com/a/94876 .

— whuber

4

@ MarkL.Stone відповіді - це більше, ніж просто безпосередній запитувач (SE призначений бути сховищем гарних запитань та гарних відповідей, цінних для пізніх людей з подібними питаннями), і ми вже маємо відповіді на більш елементарний погляд на питання тут. . Деякі інші читачі можуть отримати щось із менш елементарного сприйняття речей, тому різноманітність стилів та рівнів відповідей робить питання корисним для більшості людей.

— Glen_b -Встановіть Моніку

10

Так, таке розподіл можна знайти. Насправді ви можете взяти будь-який розподіл із кінцевою дисперсією та масштабом, щоб відповідати вашим умовам, оскільки

V a r [c X] = c^{2} V a r [X]

$Var[cX]=c^2Var[X]$

Наприклад, рівномірний розподіл на інтервал $[0,1]$ має дисперсію:

σ^{2} = \frac{1}{12}

$\sigma^2=\frac{1}{12}$ Отже, рівномірний розподіл в інтервалі

[0, \frac{1}{\sqrt{12 r}}]

$\left[0,\frac{1}{\sqrt{12r}}\right]$ буде мати дисперсію

r

$r$ .

Насправді це звичайний спосіб додавання параметрів до деяких розподілів, наприклад, Student t. Він має лише один параметр, $\nu$ - ступеня свободи. Коли $\nu\to\infty$ розподіл переходить до стандартного нормального. Він має дзвіночну форму і дуже схожий на звичайний, але має жирніші хвости. Ось чому його часто використовують як альтернативу нормальному розподілу, коли хвости жирні. Єдина проблема полягає в тому, що розподіл Гаусса має два параметри. Отже, виходить масштабована версія розповсюдження Student t, яку іноді називають " t шкалою розташування" . Це дуже просте перетворення: $\xi=\frac{t-\mu}{s}$ , де $\mu,s$ - розташування та масштаб. Тепер ви можете встановити масштаб так, щоб нова змінна $\xi$ матиме будь-яку необхідну дисперсію та матиме форму розподілу Student t.

— Аксакал
джерело