Відповідь: Θ(mnlogn−−−−−√) .
Застосовуючи багатовимірну версію теореми про центральний межа, ми отримуємо, що вектор має асимптотично багатоваріантний гауссовий розподіл з
і
Нижче будемо вважати, що - гауссовий вектор (і не тільки приблизно гауссовий вектор). Давайте додамо Gaussian випадкову змінну з дисперсією для всіх ( не залежить від усіх ). Тобто нехай
V a r [ X i ] = m ( 1(X1,…,Xn)Cov(Xi,Xj)=-m/n2. XZm/n2XiZXi( Y 1 Y 2 ⋮ Y n )=( X 1 +Z X 2 +Z⋮ X n +Z). (Y1
Var[Xi]=m(1n−1n2),
Cov(Xi,Xj)=−m/n2.
X Zm/n2XiZXi⎛⎝⎜⎜⎜⎜Y1Y2⋮Yn⎞⎠⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜X1+ZX2+Z⋮Xn+Z⎞⎠⎟⎟⎟⎟.
вектор Гаусса . Тепер кожен має дисперсію :
і всі незалежні:
Y i m / n V a r [ Y i ] = V a r [ X i ] + 2 C o v ( X i , Z ) ⏟ =(Y1,…,Yn)Yim/nYiCov(Yi,Yj)=Cov(Xi,Xj)+ C o v ( X i , Z ) + C o v ( X j , Z ) ⏟ =Var[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
YiCov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.
Зауважимо, що . Таким чином, наша оригінальна задача еквівалентна проблемі пошуку . Давайте спочатку для простоти проаналізуємо випадок, коли всі мають відхилення .Y m a x - Y s e c - m a x Y i 1Yi−Yj=Xi−XjYmax−Ysec−maxYi1
Проблема. Нам задано незалежних гауссових rv із середнім та дисперсією . Оцініть очікування .γ 1 , … , γ n μ 1 γ m a x - γ s e c - m a xnγ1,…,γnμ1γmax−γsec−max
Відповідь: .Θ(1logn√)
Неформальне підтвердження.
Ось неформальне рішення цієї проблеми (не важко зробити це формальним). Оскільки відповідь не залежить від середнього значення, вважаємо, що . Нехай , де . У нас є (для помірно великих ),
ˉ Φ ( t ) = Pr [ γ > t ] γ ∼ N ( 0 , 1 ) t ˉ Φ ( t ) ≈ 1μ=0Φ¯(t)=Pr[γ>t]γ∼N(0,1)t
Φ¯(t)≈12π−−√te−12t2.
Зауважте, що
[ 0 , 1 ]Φ(γi) рівномірно та незалежно розподілені на ,[0,1]
Φ ( γ i )Φ(γmax) найменший серед ,Φ(γi)
Φ(γsec−max) є другим найменшим серед .Φ(γi)
Таким чином, близький до і близький до (концентрації немає, але якщо ми не будемо ' t дбаючи про константи, ці оцінки досить хороші; насправді вони навіть дуже хороші, якщо ми дбаємо про константи - але для цього потрібне обґрунтування). Використовуючи формулу для , отримуємо, що
Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)
2≈Φ¯(γsec−max)/Φ¯(γmax)≈e12(γ2max−γ2sec−max).
Таким чином, є whp Зверніть увагу, що . У нас є
γ2max−γ2sec−maxΘ(1)γmax≈γsec−max=Θ(logn−−−−√)
γmax−γsec−max≈Θ(1)γmax+γsec−max≈Θ(1)logn−−−−√.
QED
Ми отримуємо це
E[Xmax−Xsec−max]=E[Ymax−Ysec−max]=Var[Yi]−−−−−−√×E[γmax−γsec−max]=Θ(mnlogn−−−−−−√).
Той самий аргумент проходить і тоді, коли ми маємо довільні оцінки. З нього видно, що
E[Xmax−Xsec−max]=cE[Xmax−Xmin]/logn.