Чи можна для заданого постійного числа (наприклад, 4) знайти розподіл ймовірностей для , щоб у нас було ?
Чи можна для заданого постійного числа (наприклад, 4) знайти розподіл ймовірностей для , щоб у нас було ?
Відповіді:
Уважно розглядаючи справи для : якщо то розподіл вироджений, але може мати будь-яке значення. Це є,і для будь-якого . Таким чином, ми можемо знайти багато можливих розподілів для , але вони індексовані та повністю визначені .
Якщо , розподілу не можна знайти, оскільки .
Для , то відповідь буде залежати від того, яка додаткова інформація відома про . Наприклад, якщо як відомо, має середнє значення , тоді для будь-яких і ми можемо знайти розподіл за цими моментами, взявши . Це не унікальне рішення проблеми відповідності середнього та дисперсійного, але це єдине нормально розподілене рішення (і з усіх можливих рішень це саме те, що максимізує ентропію, як вказує Даніель). Якщо ви також хотіли відповідати, наприклад, третьому центральному моменту або вище, тоді вам слід розглянути більш широкий спектр розподілу ймовірностей.
Припустимо, замість цього ми мали деяку інформацію про розподіл а не про його моменти. Наприклад, якщо ми знаємо, що слідує за розподілом Пуассона, унікальним рішенням буде . Якщо ми знаємо, що слідує за експоненціальним розподілом, то знову є унікальне рішення , де ми знайшли параметр, вирішивши .
В інших випадках ми можемо знайти цілу сімейство рішень. Якщо ми знаємо, що слідує за прямокутним (безперервним рівномірним) розподілом, то ми можемо знайти унікальну ширину для розподілу, вирішивши . Але буде ціле сімейство рішень, параметизовані - розподіли в цьому наборі - це всі переклади один одного. Аналогічно, якщо є нормальним, тоді буде працювати будь-який розподіл (тому у нас є цілий набір рішень, індексованих , що знову може бути будь-яким реальним числом, і знову сім'я - це всі переклади один одного). Якщо слідує за розподілом гами, тоді, використовуючи параметризацію масштабу форми, ми можемо отримати ціле сімейство рішень, параметизовані на. Члени цієї родини не перекладають один одного. Щоб візуалізувати, як може виглядати "сімейство рішень", ось кілька прикладів нормальних розподілів, індексованих, а потім гамма-розподіли, індексовані , всі з відхиленням, рівним чотирма, що відповідає прикладу у вашому питанні.
З іншого боку, для деяких розподілів можливо, а може і не можливо знайти рішення, залежно від значення . Наприклад, якщо має бути змінною Бернуллі, то для є два можливі рішення оскільки є дві ймовірності які вирішують рівняння , і насправді ці дві ймовірності є взаємодоповнюючими, тобто . Для існує лише унікальний розчин , а для відсутність розподілу Бернуллі не має достатньо великої дисперсії.
Я вважаю, що слід також згадати випадок . Є рішення для цього випадку теж, наприклад Стьюдент розподілу з двома ступенями свободи.
R код сюжетів
require(ggplot2)
x.df <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")
x.df <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
coord_cartesian(ylim = c(0, 1))
Якщо припустити, що ви маєте на увазі "чи можна знайти розподіл ймовірності для"тоді відповідь" так ", оскільки ви не вказали жодних критеріїв, які повинні задовольняти. Насправді існує нескінченна кількість можливих розподілів, які б задовольнили цю умову. Просто врахуйте нормальний розподіл,. Ви можете встановити і Ви можете прийняти будь-яке значення, яке вам подобається - тоді ви матимете по мірі необхідності.
Насправді нормальний розподіл є досить особливим у цьому плані, оскільки це максимальний розподіл ймовірності ентропії для заданого середнього та дисперсії.
Це питання можна інтерпретувати так, що робить його цікавим та не зовсім тривіальним. Дав щосьщо виглядає як випадкова величина, наскільки можливо присвоїти ймовірності своїм значенням (або змістити існуючі ймовірності навколо) таким чином, щоб її дисперсія дорівнювала деякому попередньо визначеному числу? Відповідь полягає в тому, що всі можливі значення допустимі до межі, визначеної діапазоном .
Потенційний інтерес до такого аналізу полягає в ідеї зміни міри ймовірності, зберігаючи фіксовану випадкову змінну, щоб досягти певної мети. Хоча ця програма проста, вона відображає деякі ідеї, що лежать в основі теореми Гірсанова , основоположного в математичному фінансі .
Повторимо це питання строго, однозначно. Припустимо
є вимірюваною функцією, визначеною на просторі вимірювання з сигма-алгеброю . Для заданого реального числа, коли можливо знайти міру ймовірності на цьому просторі, для якого ?
Я вважаю, що відповідь полягає в тому, що це можливо, коли. (Рівність може бути дотримана, якщо досягнуті обидва вище і найвищого рівня: тобто вони фактично є максимумом і мінімумом.) Коли будь-який або ця умова не обмежує , і тоді можливі всі негативні значення дисперсії.
Доказ - це конструкція. Почнемо з простої його версії, подбати про деталі та закріпити основну ідею, а потім перейти до власне побудови.
Дозволяє бути в образі : це означає, що є для котрого . Визначте задану функцію бути показником : це є, якщо і коли .
З тих пір , очевидно задовольняє перші дві аксіоми ймовірності . Треба показати, що вона задовольняє третю; а саме, що це сигма-добавка. Але це майже так само очевидно: щоразу є кінцевою або незліченною нескінченною сукупністю взаємовиключних подій, то жодна з них не містить --У якому випадку для усіх - або саме один з них містить , У якому випадку для якогось конкретного інакше для усіх . В будь-якому випадку
тому що обидві сторони або обидві або обидва .
З тих пір концентрує всю ймовірність на , розповсюдження зосереджена на і повинна мати нульову дисперсію.
Дозволяє бути двома значеннями в діапазоні ; це є, і . У спосіб, аналогічний попередньому кроку, визначте міру бути середньозваженим показником показників і . Використовуйте негативні ваги і для бути визначеним. Як і раніше, ми знаходимо це- будучи опуклою комбінацією показникових показників, обговорених у (1) - є мірою ймовірності. Розподіл стосовно цього заходу є Бернуллі розповсюдження, яке масштабується і зміщений на . Бо дисперсія Бернуллі поширення є , дисперсія повинно бути .
Безпосереднім наслідком (2) є те, що будь-який для яких існують в діапазоні і для котрого
може бути дисперсією . З тих пір, це означає
при рівності, якщо і тільки якщо має максимум і мінімум.
І навпаки, якщо перевищує цю межу , тоді рішення неможливо, оскільки ми вже знаємо, що дисперсія будь-якої обмеженої випадкової величини не може перевищувати чверті квадрата її діапазону.
Так, таке розподіл можна знайти. Насправді ви можете взяти будь-який розподіл із кінцевою дисперсією та масштабом, щоб відповідати вашим умовам, оскільки
Наприклад, рівномірний розподіл на інтервал має дисперсію:
Насправді це звичайний спосіб додавання параметрів до деяких розподілів, наприклад, Student t. Він має лише один параметр,- ступеня свободи. Колирозподіл переходить до стандартного нормального. Він має дзвіночну форму і дуже схожий на звичайний, але має жирніші хвости. Ось чому його часто використовують як альтернативу нормальному розподілу, коли хвости жирні. Єдина проблема полягає в тому, що розподіл Гаусса має два параметри. Отже, виходить масштабована версія розповсюдження Student t, яку іноді називають " t шкалою розташування" . Це дуже просте перетворення:, де - розташування та масштаб. Тепер ви можете встановити масштаб так, щоб нова змінна матиме будь-яку необхідну дисперсію та матиме форму розподілу Student t.