Питання задає дві речі: (1) як показати, що максимум сходиться, в тому сенсі, що ( X ( n ) - b n ) / a n конвергується (у розподілі) для відповідно обраних послідовностей ( a n ) та ( b n ) - до стандартного розподілу Гумбеля та (2) як знайти такі послідовності.X(n)(X(n)−bn)/an(an)(bn)
Перший добре відомий і задокументований в оригінальних працях з теореми Фішера-Тіппетта-Гнеденка (FTG). Другий видається складнішим; це питання, яке тут розглядається.
Зауважте, для уточнення деяких тверджень, що з’являються в інших місцях цієї теми, це
Максимум ні до чого не сходиться: він розходиться (хоча і надзвичайно повільно).
Здається, існують різні конвенції, що стосуються розподілу Гумбеля. Я прийму конвенцію про те, що CDF зворотного розподілу Гумбеля до масштабу та розташування задається . Відповідно стандартизований максимум iid Normal змінних переходить до зворотного розподілу Gumbel.1−exp(−exp(x))
Інтуїція
Коли є iз загальною функцією розподілу F , розподіл максимуму X ( n ) єXiFX(n)
Fn(x)=Pr(X(n)≤x)=Pr(X1≤x)Pr(X2≤x)⋯Pr(Xn≤x)=Fn(x).
Коли підтримка не має верхньої межі, як при нормальному розподілі, послідовність функцій F n рухається назавжди вправо без обмежень:FFn
Показані часткові графіки для n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16 .Fnn=1,2,22,24,28,216
Для вивчення форми цих розподілів, ми можемо зрушити кожен його назад вліво на деяку величину і масштабувати його в п , щоб зробити їх порівнянними.bnan
Кожен з попередніх графіків зміщений, щоб розмістити свою медіану на і скласти свій міжквартильний діапазон одиничної довжини.0
FTG стверджує, що послідовності та ( b n ) можна вибирати так, щоб ці функції розподілу точково сходилися на кожному x до деякого розподілу крайніх значень , аж до масштабу та місця розташування. Коли F - це нормальний розподіл, особливим обмежуючим граничним значенням розподілу є зворотна гумка, до місця розташування та масштабу.(an)(bn)xF
Рішення
Привабливо наслідувати теорему центрального граничного рівня, стандартизуючи щоб мати середню одиницю та відхилення одиниці. Це частково недоцільно, оскільки FTG застосовується навіть до (безперервних) дистрибутивів, у яких немає першого чи другого моменту. Натомість використовуйте перцентиль (такий як медіана) для визначення місця розташування та різниці процентів (наприклад, IQR) для визначення спред. (Цей загальний підхід повинен вдалося знайти в п і б п для будь-якого безперервного розподілу.)Fnanbn
Для звичайного звичайного розподілу це виявляється просто! Нехай . Квантилем F n, що відповідає q, є будь-яке значення x q, для якого F n ( x q ) = q . Згадуючи визначення F n ( x ) = F n ( x ) , рішення є0<q<1FnqxqFn(xq)=qFn(x)=Fn(x)
xq;n=F−1(q1/n).
Тому ми можемо встановити
bn=x1/2;n, an=x3/4;n−x1/4;n; Gn(x)=Fn(anx+bn).
Оскільки за побудовою медіана дорівнює 0, а IQR - 1 , медіана граничного значення G n (яка є деякою версією зворотного Gumbel) повинна бути 0, а його IQR повинен бути 1 . Нехай параметр масштабу буде β, а параметр розташування - α . Оскільки медіана α + β журналу журналу ( 2 ) і IQR виявляється β ( log log ( 4 ) - log log ( 4)Gn01Gn01βαα+βloglog(2) , параметри повинні бутиβ(loglog(4)−loglog(4/3))
α=loglog2loglog(4/3)−loglog(4); β=1loglog(4)−loglog(4/3).
Це не є необхідним для і б п бути саме ці значення: вони тільки апроксимувати їх, при умови , що межа G п досі це зворотне розподіл Гамбела. Відвертий (але виснажливий) аналіз для стандартного нормального F вказує на те, що наближенняanbnGnF
a′n=log((4log2(2))/(log2(43)))22log(n)−−−−−−√, b′n=2log(n)−−−−−−√−log(log(n))+log(4πlog2(2))22log(n)−−−−−−√
буде добре працювати (і максимально простий).
Gnn=2,26,211,216a′nb′nαβx
Список літератури
Б. В. Генденко, Про обмежувальний розподіл максимального члена у випадковому ряді . У «Коц і Джонсон», « Прориви статистики», том I: Основи та основні теорії, Спрингер, 1992. Переклад: Норман Джонсон.