Який найпотужніший результат щодо максимуму гайдаків? Найбільше використовується на практиці?


9

З огляду на , розглянути випадкові величиниX1,,Xn,N(0,1)

Zn:=max1inXi.

Питання: Який найважливіший результат щодо цих випадкових величин?

Для уточнення "важливості", який результат має найбільше інших таких результатів як логічний наслідок? Який із результатів використовується найчастіше на практиці?

Більш конкретно, серед (теоретичних) статистиків здається, що фольклорні знання про те, що Zn "в основному такі ж, як" 2logn , принаймні асимптотично. (Дивіться це пов'язане питання .)

Однак існує багато подібних результатів подібного типу, і, здається, так трапляється, що більшість не є еквівалентними і не мають на увазі один одного. Наприклад, ,

(1)Zn2logna.s.1,

яка, якщо нічого іншого, також не передбачає відповідних результатів у ймовірності та розподілі.

Однак це навіть не передбачає, здається, також пов'язаних результатів (див. Це інше питання ), наприклад

(2)limnEZn2logn=1,

(це вправа 2.17 на стор. 49 ) або інший результат фольклору :

(3)EZn=2logn+Θ(1).

Несимптотично також відомо, що для кожного (див. Тут для підтвердження),n

(4)clognEZn2logn

для деяких малих . Подібні результати також можуть бути показані для, оскільки сильно косий правою.c|Zn|Zn

Доказ цього останнього результату набагато простіший, ніж докази інших результатів. Я сподівався, що перший асимптотичний результат мав би на увазі всі інші асимптотичні, щоб я міг впевнено зосередити весь свій час і енергію на розумінні цього результату. Але, знову ж таки, це, здавалося б, не відповідає дійсності , тому зараз мені незрозуміло, на що я повинен зосередитися.

Див. С. 265-267 другого видання «Галамбос», «Асимптотична теорія статистики надзвичайних порядків» , надрукованого в 1987 р. Про це, мабуть, також йдеться десь у першому виданні.

Бушерон, Лугосі, Массарт, Нерівності концентрації: неасимптотична теорія незалежності . Убік: Ця книга фактично цитує Галамбоса за відповідний результат, але я не можу знайти його згадуваний ніде в Галамбосі - лише перший результат, який я згадав.


1
Чи знаєте ви, що коли ви використовуєте \ dots у MathJax, результат іноді видається так, ніби ви використовували \ ldots, а іноді так, ніби ви використовували \ cdots, залежно від контексту? У цьому запитанні я замінив \ крапки на \ ldots.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Майкл Харді

@MichaelHardy О, я думав, це завжди в центрі. Дякуємо за виправлення!
Chill2Macht

Відповіді:


4

У будь-якому ймовірнісному застосуванні найбільш фундаментальним об'єктом є розподіл, з якого випливають моменти та обмежувальні властивості. Отже, найважливішим результатом у описаному вами сенсі є функція повного розподілу (рівнозначно, відповідна функція щільності). На практиці цей розподільний результат є, мабуть, менш висвітлюючим, ніж деякі більш основні асимптотичні властивості, які ви вже перелічили. Хоча це, логічно, передбачає ці асимптотичні результати, на мій погляд, ці результати, ймовірно, будуть більш яскравими в розумінні мінливого характеру крайнього значення, коли ми змінюємо .FZn(z)=Φn(z)n

З вашого запитання видно, що ви добре розумієте властивості екстремальних значень у випадку максимуму стандартних випадкових змінних IID. Усі ці властивості логічно випливають із функції розподілу для , тому це є найбільш фундаментальним об'єктом у цій проблемі. Як і у багатьох випадках, найбільш фундаментальний об'єкт не обов'язково є найбільш освітлюючим, і тому ви, мабуть, виявите, що вам доведеться поступати, знаючи всі результати та знаючи, що вони висвітлюють різні аспекти проблеми.Zn


Дякую за цю відповідь - я ціную це. Чи знаєте ви посилання на те, як вивести всі ці властивості з функції розподілу для ? У мене виникли надзвичайні труднощі знайти щось, що пояснює це, тому що це все або "фольклор", або "тримання за руки". Zn
Chill2Macht

Для запису я прочитав посилання, і вони не допомагають. Ось чому я задав питання.
Chill2Macht

1
Я не маю конкретних посилань, щоб рекомендувати, але я думаю, що ці результати будуть отримані в книгах з теорії екстремальної вартості. Я б запропонував вам почати з пошуку текстів випускників на цю тему і побачити, чи можете ви знайти там вихідні матеріали.
Бен - Відновіть Моніку

1

WIP: Незавершена робота

Слідом за с. 370 математичних методів статистики Креймера 1946 р. ВизначтеТут - функція кумулятивного розподілу стандартного нормального розподілу, . Як наслідок його визначення, ми гарантуємо, що майже точно.

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

Розглянемо задану реалізацію нашого простору зразка. Тоді в цьому сенсі є і функцією і , і функцією і . Для фіксованої ми можемо вважати детермінованою функцією , а детермінованою функцією і , тим самим спрощуючи задачу. Ми прагнемо показати результати, які майже напевно справедливі для всіхωΩZnnωΞnZn,nωωZnnΞnZnnωΩ, що дозволяє нам перенести наші результати з недетермінованого аналізу в недетерміновану установку.

Слідом за с. 374 Математичних методів статистики Креймера 1946 року , припустимо на даний момент (я маю на меті повернутися і подати докази пізніше), що ми здатні показати, що (для будь-якого даного ) має місце наступне асимптотичне розширення (використовуючи інтеграція за частинами та визначення ):ωΩΦ

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

Ясно , що ми маємо , що для будь-якого , і майже напевно зростаюча функція від в , тому ми стверджуємо , надалі в протягом усього цього для (майже напевно все) фіксована :Zn+1ZnnZnnnω

Znn.

Звідси випливає, що маємо (де позначає асимптотичну еквівалентність ):

2πnΞn1Zne1Zn2  as  Znn.

Як ми поступаємо далі, суттєво відповідає методу домінуючого балансу , і наші маніпуляції будуть формально виправдані наступною лемою:

Лемма: Припустимо, що як , і (таким чином ). Тоді, задаючи будь-яку функцію яка формується за допомогою композицій, доповнень та множень логарифмів та законів потужності (фактично будь- яка функція " полілог "), ми повинні мати також, що як :Іншими словами, такі «полілогічні» функції зберігають асимптотичну еквівалентність .f(n)g(n)nf(n)g(n)hn

h(f(n))h(g(n)).

Істинність цієї леми є наслідком теореми 2.1. як написано тут . Зауважимо також, що далі йдеться в основному про розширену (більш детальну) версію відповіді на подібне запитання, знайдене тут .

Беручи логарифми обох сторін, отримуємо:

(1)log(2πΞn)lognlogZnZn22.

Ось де Крамер дещо клітковий; він просто каже, "припускаючи, що обмежений", ми можемо зробити висновок про бла-бла-бла. Але показ того, що відповідно обмежений майже напевно, здається, насправді дещо нетривіальним. Здається, що доказ цього може бути, по суті, частиною того, що обговорюється на стор. 265-267 Галамбоса, але я не впевнений, враховуючи, що я все ще працюю над тим, щоб зрозуміти зміст цієї книги.ΞnΞn

У будь-якому випадку, якщо припустити, щоlogΞn=o(logn) , то з цього випливає (оскільки термін домінує над терміном ), що:Zn2/2logZn

lognZn22Zn2logn.

Це дещо приємно, оскільки це вже більшість із того, що ми хочемо показати, хоча знову ж таки варто зазначити, що це по суті лише по дорозі, оскільки тепер ми повинні показати певну майже обмеженість . З іншого боку, має однаковий розподіл для будь-якого максимуму iid безперервних випадкових змінних, тому це може бути простежено.ΞnΞn

У будь-якому випадку, якщо як, то однозначно можна також зробити висновок, що для будь-якого що є як . Використовуючи нашу лему про полілогічні функції, що зберігають асимптотичну еквівалентність вище, ми можемо замінити це вираз на щоб отримати:Zn2lognZn2logn(1+α(n))α(n)o(1)n(1)

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Тут ми повинні піти ще далі і припустити, що майже точноlogΞn=o(loglogn)  as  n . Знову ж таки, все, що говорить Креймер, "припускають, що обмежений". Але оскільки все можна апріорі сказати про це те, що as, навряд чи зрозуміло, що треба мати майже напевно, що, здається, є суть твердження Крамера.ΞnΞn0XinnΞn=O(1)

Але в будь-якому випадку, якщо вважати, що це вважає, то випливає, що домінуючим терміном, який не містить є . Оскільки , то випливає, що , і чітко , тому домінуючим терміном, що містить є . Тому ми можемо переставити і (розділивши все на або ) знайти цеα12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn

12loglogn2αlognαloglogn4logn.

Отже, підміняючи це назад у вищезазначене, ми отримуємо це:

Zn2lognloglogn22logn,

знову ж таки, припускаючи, що ми віримо певним речам про .Ξn

Ми знову переробляємо ту саму техніку; оскільки , то також випливає, щоZn2lognloglogn22logn

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

коли . Давайте трохи спростимо перед тим, як підставити безпосередньо назад у (1); ми отримуємо це:β(n)=o(1)

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Підставляючи це назад у (1), знаходимо, що:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Тому ми робимо висновок, що майже напевно

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

Це відповідає кінцевому результату на стр.374 математичних методів статистики Креймера 1946 року, за винятком того, що тут не вказано точний порядок терміна помилки. Мабуть, застосовуючи цей ще один термін, вказується точний порядок помилки, але все-таки не здається необхідним доводити результати щодо максимумів стандартних нормальних стандартів, в яких нас цікавлять.


Враховуючи результат викладеного, а саме, що майже напевно:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Тоді з лінійності очікування випливає, що:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Тому ми це показали

limnEZn2logn=1,

до тих пір, поки ми можемо це також показати

E[logΞn]=o(logn).

Це може бути не надто складно показати, оскільки знову має однаковий розподіл для кожної безперервної випадкової величини. Таким чином, ми маємо другий результат зверху.Ξn

1. Аналогічно, ми маємо також із сказаного, що майже напевно:

Zn2logn=1log(Ξn)2logn+o(1),.

Тому, якщо ми можемо показати, що:

(*)log(Ξn)=o(logn) almost surely,

тоді ми показали перший результат зверху. Результат (*) також чітко означатиме, що , тим самим даючи нам перший результат зверху.E[log(Ξn)]=o(logn)

Також зауважте, що у доказі вище ( ) нам потрібно було припустити, що майже напевно (або принаймні щось подібне), так що якщо ми можемо показати ( ), то ми, швидше за все, також матимемо процес, необхідний для показу майже напевно, і тому, якщо ми зможемо довести ми, швидше за все, зможемо негайно дійти до всіх наступних висновків.Ξn=o(logn)Ξn=o(logn)()

3. Однак, якщо ми маємо цей результат, то я не розумію, як можна було б мати , оскільки . Але принаймні, здавалося б, правда, щоEZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


Тоді здається, що ми можемо зосередитися на тому, щоб відповісти на питання, як показати, що

Ξn=o(logn) almost surely.

Нам також потрібно буде провести грубу роботу з надання доказів для (~), але, наскільки мені відомо, це просто обчислення і не передбачає теорії ймовірностей, хоча мені ще належить сісти і спробувати це.

Спочатку переглянемо ланцюжок дрібниць, щоб перефразувати проблему таким чином, що полегшує її вирішення (зауважимо, що за визначенням ):Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

Також є таке:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

Відповідно, визначте для всіх :n

un(ε)=inf{y:F(y)1εlognn}.

Тому наведені вище кроки показують нам, що:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Зауважте, що ми можемо написати:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

Послідовності стають рівномірно більшими, коли зменшується, тому можна зробити висновок, що події зменшуються (або хоча б якось монотонно) як переходить до . Тому аксіома вірогідності щодо монотонних послідовностей подій дозволяє зробити висновок про те, що:un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Тому досить показати, що для всіх ,ε>0

P(Znun(ε) infinitely often)=0

оскільки звичайно межа будь-якої постійної послідовності є постійною.

Ось дещо результат кувалди:

Теорема 4.3.1., С. 252 Галамбос, Асимптотична теорія статистики надзвичайних порядків , 2-е видання. Нехай є iid змінними із загальною невідродженою та безперервною функцією розподілу , і нехай не послідовність, така що також не зменшується. Тоді для , відповідно до X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

Доказ технічний і займає близько п’яти сторінок, але в кінцевому підсумку це виявляється наслідком однієї з лем Бореля-Кантеллі. Я можу обійтись намаганням звести доказ, щоб використовувати лише ту частину, яка необхідна для цього аналізу, а також лише ті припущення, які існують у справі Гаусса, які можуть бути коротшими (але, можливо, це не так), і введіть їх тут, але затримувати дихання не рекомендується. Зверніть увагу , що в цьому випадку , так що умова беззмістовно і є , таким чином , очевидно , не убуває.ω(F)=+n(1F(n))εlogn

У будь-якому сенсі це, звертаючись до цієї теореми, якщо ми можемо показати, що:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Зауважимо, що оскільки логарифмічний ріст повільніше, ніж будь-який ріст закону влади, для будь-якого позитивного показника закону сили (логарифми та експоненціали зберігають монотонність, тому і колишню нерівність завжди можна побачити на всіх достатньо великим через те, що та зміна змінних), ми маємо це:loglognαlognlognnαnlognn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

оскільки p-ряд, як відомо, збігається для всіх , а звичайно, має на увазі .p>1ε>01+ε/2>1

Таким чином, використовуючи вищевикладену теорему, ми показали, що для всіх , , що для рекапітуляції повинно означати, що майже точно.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

Нам потрібно ще показати, що . Це не випливає з вищесказаного, оскільки, наприклад,logΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

Однак, з огляду на послідовність , якщо можна показати, що для довільного , то це випливає, що . В ідеалі я хотів би мати можливість показати це для використовуючи вищевказану лему (припустимо, що це навіть правда), але я не в змозі (поки що).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.