Незаангажована оцінка медіани


16

Припустимо, що у нас [ 0 , 1 ] підтримується випадкова величина X , з якої ми можемо робити вибірки. Як ми можемо придумати неупереджену оцінку медіани X ?X[0,1]X

Ми, звичайно, можемо генерувати деякі зразки та брати медіану вибірки, але я розумію, що це взагалі не буде об'єктивним.

Примітка: це питання пов'язане, але не тотожне моєму останньому запитанню , і в цьому випадку XX можна було вибірково лише приблизно.

Відповіді:


13

Такого оцінника не існує.

Інтуїція полягає в тому, що медіана може залишатися фіксованою, поки ми вільно зміщуємо щільність ймовірностей навколо обох її сторін, так що будь-який оцінювач, середнє значення якого є медіаною для одного розподілу, матиме різне середнє для зміненого розподілу, що робить його упередженим. Наступна експозиція дає трохи більше суворості цій інтуїції.


Ми зосереджені на розподіл РF , що має унікальні медіани мm , так що за визначенням F ( м ) 1 / 2F(m)1/2 і Р ( х ) < 1 / 2F(x)<1/2 для всіх х < мx<m . Зафіксуйте розмір вибірки n 1n1 і припустимо, що t : [ 0 , 1 ] n[ 0 , 1 ]t:[0,1]n[0,1] оцінює mm . (Досить буде т. Звtлише обмежений, але зазвичай не варто серйозно розглянути оцінки, які дають очевидно неможливі значення.) Ми не робимо припущень щодо t ; це навіть не повинно бути безперервним нікуди.t

Сенс t неупередженості (для цього фіксованого розміру вибірки) полягає в томуt

E F [ t ( X 1 , , X n ) ] = m

EF[t(X1,,Xn)]=m

для будь-якого н.о.р. зразка з X я ~ F . «Несмещенная оцінка» т є один з цією властивістю для всіх таких F .XiFtF

Припустимо, існує неупереджений оцінювач. Ми виведемо протиріччя, застосувавши його до особливо простого набору розподілів. Розглянемо розподіли F = F x , y , m , ε, що мають ці властивості:F=Fx,y,m,ε

  1. 0 x < y 1 ;0x<y1

  2. 0 < ε < ( y - x ) / 4 ;0<ε<(yx)/4

  3. x + ε < m < y - ε ;x+ε<m<yε

  4. Pr ( X = x ) = Pr ( X = y ) = ( 1 - ε ) / 2 ;Pr(X=x)=Pr(X=y)=(1ε)/2

  5. Pr ( m - ε X m + ε ) = ε ; іPr(mεXm+ε)=ε

  6. F рівномірний на [ m - ε , m + ε ] .F[mε,m+ε]

Ці розподіли розміщують ймовірність ( 1 - ε ) / 2 на кожному з x і y і невелику кількість ймовірностей, симетрично розміщених навколо m між x і y . Це робить м унікальний медіану F . (Якщо ви стурбовані тим, що це не безперервний розподіл, зв’яжіть його з дуже вузьким гауссом і обріжте результат до [ 0 , 1 ] : аргумент не зміниться.)(1ε)/2xymxymF[0,1]

Тепер, для будь-якого передбачуваних медіанний оцінок т , його можна легко оцінка показує , що E [ т ( Х 1 , Х 2 , ... , X п ) ] строго в межах е від середньої величини 2 п значень т ( х 1 , х 2 , , X n ) де x i змінюється в усіх можливих комбінаціях x і y . Однак ми можемо змінювати mtE[t(X1,X2,,Xn)]ε2nt(x1,x2,,xn)xixymміж x + ε і y - ε , зміна щонайменше ε (в силу умов 2 і 3). Таким чином, існує m , і звідки відповідний розподіл F x , y , m , ε , для якого це очікування не дорівнює медіані, QED.x+εyεεmFx,y,m,ε


(+1) Nice proof. Did you come up with it, or is it something you remembered from the grad school?
StasK

4
Here is another proof: Most Bernoulli random variables have median 00 or 11. The estimate from nn trials depends only on the average values of the estimator on the vertices of [0,1]n[0,1]n with kk, and the weights of these average values is a polynomial in pp of degree nn. If this is an unbiased estimator, it must have average value 11 for any p>1/2p>1/2, and there are more than n+1n+1 such values of pp, so this polynomial must be constant... but it must be 00 on lower values of pp, so it can't be unbiased there, too.
Douglas Zare

1
@Douglas That's a great proof. I suspect some people might feel a little uneasy about the scope of its applicability, though, because the median for a Bernoulli variable is somewhat special, being coincident with one of its two support points (except when p=1/2p=1/2). Readers might be tempted to declare this as "pathological" and try to bar such monsters by looking only at continuous distributions with everywhere positive densities on their domains. That's why I took care to show that such efforts will fail.
whuber

3

Finding an unbiased estimator without having a parametric model would be difficult! But you could use bootstrapping, and use that to correct the empirical median to get an approximately unbiased estimator.


If this is impossible, is it possible to prove it? For example, if X1,X2,,XnX1,X2,,Xn are independent samples from XX then can one prove that f(X1,,Xn)f(X1,,Xn) cannot be unbiased for any choice of ff?
robinson

2
I think kjetil is saying that in a nonparametric framework there is no method that will give an unbiased estimate for every possible distribution. But in the parametric framework you probably could. Bootstrapping a biased sample estimate can allow you to estimate the bias and adjust it to get a bootstrap estimate that is nearly unbiased. That was his suggestion for handling the problem in the nonparametric framework. Proving that an unbiased estimate is not possible would also be difficult.
Michael R. Chernick

2
If you really want to try to prove that there do not exist an unbiased estimator, there is a book, Ferguson: "Mathematical Statistics - A Decision Theoretic Approach" which do have some examples of that kind of thing!
kjetil b halvorsen

I imagine that the regularity conditions for the bootstrap will be violated with the distribution functions that whuber considers in his answer. Michael, can you comment?
StasK

2
@Stas As I pointed out, my functions can be made to look very "nice" by mollifying them. They can also be generalized to mollifications of large finite mixtures of atoms. The class of such distributions is dense in all distributions on the unit interval, so I don't think bootstrap regularity would be involved here.
whuber

0

I believe quantile regression will give you a consistent estimator of the median. Given the model Y=α+u. And you want to estimate med(y)=med(α+u)=α+med(u) since α is a constant. All you need is the med(u)=0 which should be true so long as you have independent draws. However, as far as unbiasedness, I don't know. Medians are difficult.


See @whuber 's answer
Peter Flom - Reinstate Monica
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.