Чи завжди середньовизначна випадкова величина завжди дорівнює інтегралу її квантильної функції?


17

Я щойно помітив, що інтегруючи квантильну функцію уніваріантної випадкової змінної (зворотний cdf) від p = 0 до p = 1, створюється середнє значення змінної. Я не чув про подібні стосунки раніше, тому мені цікаво: чи завжди це так? Якщо так, то ці стосунки широко відомі?

Ось приклад в python:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

Відповіді:


26

Нехай F - CDF випадкової величини X , тому обернену CDF можна записати F1 . У вашому інтегралі зробіть підстановку p=F(x) , dp=F(x)dx=f(x)dx щоб отримати

01F1(p)dp=xf(x)dx=EF[X].

Це справедливо для безперервного розповсюдження. Необхідно бути обережним для інших розподілів, оскільки обернений CDF не має унікального визначення.

Редагувати

Коли змінна не є неперервною, вона не має розподілу, який є абсолютно неперервним щодо міри Лебега, вимагає обережності у визначенні зворотного CDF та обережності при обчисленні інтегралів. Розглянемо, наприклад, випадок дискретного розподілу. За визначенням, це той, чий CDF F є ступеневою функцією зі ступенем розміру PrF(x) при кожному можливому значенні x .

Фігура 1

На цьому малюнку показана CDF з Бернуллі (2/3) розподіл масштабується 2 . Тобто, випадкова величина має ймовірність 1/3 з рівного 0 , і ймовірність 2/3 з рівного 2 . Висоти стрибків при 0 і 2 дають свою ймовірність. Очікування цієї змінної , очевидно , дорівнює 0×(1/3)+2×(2/3)=4/3 .

Ми могли б визначити "зворотний CDF" F1 , вимагаючи

F1(p)=x if F(x)p and F(x)<p.

This means that F1 is also a step function. For any possible value x of the random variable, F1 will attain the value x over an interval of length PrF(x). Therefore its integral is obtained by summing the values xPrF(x), which is just the expectation.

Малюнок 2

Це графік зворотного CDF попереднього прикладу. Розриви і 2 / 3 в КОР стали горизонтальні лінії цих довжин на висотах , рівних 0 і 2 , значення в яких вони відповідають ймовірності. (Зворотне ВВР не визначений за межі інтервалу [ 0 , 1 ] .) Його інтеграл є сума двох прямокутників, один з висоти 0 і підставою 1 / 3 , а інший висоти 2 і підставою 2 / 3 , на загальну суму 4 / 31/32/302[0,1]01/322/34/3, як і раніше.

Загалом, для суміші безперервного та дискретного розподілу нам потрібно визначити зворотний CDF для паралельної цієї конструкції: при кожному дискретному стрибку висоти ми повинні формувати горизонтальну лінію довжиною p , задану попередньою формулою.pp


ви помилилися в зміні змінної. звідки береться х?
Маскарпоне

3
@Mascarpone Будь ласка, прочитайте текст, що передує рівнянню. Я не думаю, що є помилка в зміні змінної :-), але якщо ви думаєте, що це уточнило б експозицію, я би радий зазначити, що коли , то x = F - 1 ( р ) . Я просто не вважав, що це потрібно. p=F(x)x=F1(p)
whuber

тепер я отримав її;),
Маскарпоне

+1 Whuber: Дякую! Не могли б ви детальніше розглянути формулу, яку ви надали, як подбати про інші дистрибутиви, чий обернений CDF не має унікального визначення?
StackExchange для всіх

1
Щоб обійти такі непрості міркування про інверсії, псевдовертання тощо, і одночасно для узагальнення кожного моменту, дивіться тут .
Чи був

9

Еквівалентний результат добре відомий в аналізі виживання : очікуваний час життя де функцією виживання є S ( t ) = Pr ( T > t ), виміряна від народження при t = 0 . (Його можна легко розширити, щоб охопити негативні значення t .)

t=0S(t)dt
S(t)=Pr(T>t)t=0t

enter image description here

Тож ми можемо переписати це як але це1 q = 0 F - 1 ( q

t=0(1F(t))dt
як показано в різних відображеннях відповідної області
q=01F1(q)dq

enter image description here


1
Мені подобаються фотографії, і інстинктивно відчуваю, що тут ховається чудова ідея - я люблю цю ідею--, але я не розумію цих конкретних. Пояснення були б корисні. Одне, що зупиняє мене на моїх слідах, - це думка намагатися розширити інтеграл до - : він повинен розходитися. (1F(t))dt
whuber

tt=0(1F(t))dtt=0F(t)dt. Note that if this converges for a distribution symmetric about 0, i.e. F(t)=1F(t) then it is easy to see that the expectation is zero. Taking a sum rather than a difference t=0(1F(t))dt+t=0F(t)dt gives the average absolute deviation about 0.
Henry

If you like diagrams, you may be interested in this 1988 paper by Lee: The Mathematics of Excess of Loss Coverages and Retrospective Rating-A Graphical Approach.
Avraham

4

We are evaluating:

enter image description here

Let's try with a simple change of variable:

enter image description here

And we notice that, by definition of PDF and CDF:

enter image description here

almost everywhere. Thus we have, by definition of expected value:

enter image description here


У заключному рядку я більш чітко пояснюю визначення очікуваної вартості. Майже скрізь посилається на рівняння вище останнього. en.wikipedia.org/wiki/Almost_everywhere
Маскарпоне

1
edited, thanx :)
Mascarpone

3

For any real-valued random variable X with cdf F it is well-known that F1(U) has the same law than X when U is uniform on (0,1). Therefore the expectation of X, whenever it exists, is the same as the expectation of F1(U):

E(X)=E(F1(U))=01F1(u)du.
The representation XF1(U) holds for a general cdf F, taking F1 to be the left-continuous inverse of F in the case when F it is not invertible.

1

Note that F(x) is defined as P(Xx) and is a right-continuous function. F1 is defined as

F1(p)=min(x|F(x)p).
The min makes sense because of the right continuity. Let U be a uniform distribution on [0,1]. You can easily verify that F1(U) has the same CDF as X, which is F. This doesn't require X to be continuous. Hence, E(X)=E(F1(U))=01F1(p)dp. The integral is the Riemann–Stieltjes integral. The only assumption we need is the mean of X exists (E|X|<).

That's the same answer as mine.
Stéphane Laurent
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.