Яка дисперсія максимуму вибірки?


13

Я шукаю межі на дисперсію максимуму набору випадкових змінних. Іншими словами, я шукаю формули закритої форми для , такі, що де X = \ {X_1, \ ldots, X_M \} є фіксованим набір M випадкових величин з кінцевими значеннями \ mu_1, \ ldots, \ mu_M та дисперсіями \ sigma_1 ^ 2, \ ldots, \ sigma_M ^ 2 .B

Var(maxiXi)B,
X={X1,,XM}Mμ1,,μMσ12,,σM2

Я можу зробити висновок, що

Var(maxiXi)iσi2,
але ця межа здається дуже слабкою . Числовий тест, схоже, вказує на те, що B=maxiσi2 може бути можливістю, але мені це не вдалося довести. Будь-яка допомога вдячна.

3
(Ви хочете припустити, що Xi є незалежними?) Гіпотеза правдоподібна, але, здається, помилкова. Наприклад, зробіть кілька випробувань, де Xi є iid з CDF 1x1s , 1x , s>3 . Дисперсія їх максимальні, по відношенню до їх загальної дисперсії, необмежено зростає при M зростає.
whuber

@whuber Спасибі, це пояснює, чому я не зміг довести цю гіпотезу :) Мені справді цікавий випадок, коли незалежні. Просто для уточнення мене найбільше цікавлять загальні межі, які використовують лише перші два моменти. Я не впевнений, чи існують більш чіткі загальні межі, ніж загальна дисперсія. Xi
Пітер

1
Я мушу зазначити, що ваша обмежена сума (якщо припустити, що вона правильна - було б непогано побачити ескіз доказу) є тісною. Наприклад, нехай підтримується на інтервалі з відхиленнями, що не перевищують і підтримується на . Тоді як, з відхиленням , але нерівність можна посилити на скільки завгодно, зменшуючи . [ - , a ] ε 2 X 1 [ a , ] max i X i = X 1 σ 2 1σ 2 1 + ( M - 1 ) ε 2 ε 2X2,,XM[,a]ε2X1[a,]maxiXi=X1σ12σ12+(M1)ε2ε2
whuber

1
Для даних iid екстремальна теорія значень забезпечує класи розподілів, до яких вибірка максимально сходиться, з певними умовами на хвостах оригінальних розподілів, що дають різні класи асимптотичних розподілів. Тож я сумніваюся, що вам вдасться отримати добру межу, виходячи лише з двох моментів, хоча я лише тангенціально знайомий з теорією.
StasK

Відповіді:


9

Для будь-яких випадкових величин найкращим загальним обмеженим є як зазначено в початковому запитанні. Ось ескіз доведення: Якщо X, Y - IID, то . Враховуючи вектор можливо залежних змінних , нехай є незалежним вектором з однаковим спільним розподілом. Для будь-якого , ми зв'язали об'єднання, що , і інтегруючи цей від до виходить заявлена ​​нерівність.X inXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X)(X1,,Xn)(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r]dr0

Якщо - індикатори IID подій вірогідності , то є показником події ймовірності . Закріпивши і нехай прагне до нуля, отримаємо і .XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2Var(maxiXi)=nϵ+O(n2ϵ2)


3

Питання про MathOverflow пов'язане з цим питанням.

Для IID випадкових величин найвища називається статистикою порядку .k

Навіть для випадкових величин IID Бернуллі дисперсія статистики будь-якого порядку, крім медіани, може бути більшою, ніж дисперсія сукупності. Наприклад, якщо дорівнює з ймовірністю і з ймовірністю і , то максимум дорівнює з вірогідністю , тому дисперсія сукупності становить а дисперсія максимум - приблизно .Xi11/1009/10M=10111/e0.090.23

Ось дві статті про відхилення статистики замовлень:

Yang, H. (1982) "Про дисперсії медіани та деякі інші статистичні дані порядку". Бик. Інст. Математика. Акад. Синиця, 10 (2) с. 197-204

Papadatos, N. (1995) "Максимальна дисперсія статистики замовлень". Енн. Інст. Статист. Математика, 47 (1) С. 185-193

Я вважаю, що верхня межа дисперсії максимуму у другій статті є . Вони вказують, що рівність не може відбутися, але будь-яке нижнє значення може виникнути для випадкових змінних IID Бернуллі.Mσ2

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.