Чи є результат, який забезпечує завантажувальний пристрій, дійсний, якщо і лише якщо статистика є рівною?


25

Протягом усієї думки ми вважаємо, що наша статистика є функцією деяких даних яка з функції розподілу ; емпірична функція розподілу нашої вибірки - . Отже є статистикою, що розглядається як випадкова величина, а - версія завантаження статистики. Ми використовуємо як відстань KSθ()X1,Xnthetas ; ( F ) θ ( F ) d FF^θ(F)θ(F^)d

Існують результати "якщо і тільки якщо" для обгрунтованості завантажувальної програми, якщо статистика є простою лінійною статистикою. Наприклад, теорема 1 від Mammen "Коли працює завантажувальна програма?"

Якщо для деякої довільної функції завантажувальна програма працює в тому сенсі, що якщо і тільки якщо існують і t_n такі, що d_ \ infty \ big [\ mathscr {L} (\ theta (F) -t_n), N (0, \ sigma_n ^ 2) \ big] \ underset {p} {\ rightarrow} 0 Де ми можемо визначити \ hat {t_n} як деяку функцію нашого зразка і t_n = \ mathbb {E} (\ hat {t} _n)θ(F)=1ni1nhn(Xi)hn

d[L(θ(F^)t^n),L(θ(F)tn)]p0
σntn^ т п т п = Е ( т п )
d[L(θ(F)tn),N(0,σn2)]p0
tn^tn=E(t^n)

Існують також більш загальні результати того, що завантажувальний пристрій працює для загальної статистики, наприклад, теорема 1.6.3 з підгрупування від Politis Romano and Wolf:

Припустимо, що F виведено з класу всіх дистрибутивів з кінцевою підтримкою. Припустимо, що статистика θ() є Frechet диференційованою при F відносно норми надсуму, і похідна g_FgF задовольняє 0<VarF[gF(x)]< . Тоді θ(F) асимптотично нормальний, і завантажувальна програма працює у значенні попередньої теореми.

Я хотів би версію другої теореми "якщо і тільки якщо". Для цього знадобиться поняття гладкості, яке відрізняється від диференційованості Фреше, оскільки Politis, Romano і Wolf (1999) показують, що медіанна проба не є диференційованою за Фреше, але завантажувальна папка все ще працює. Однак медіана вибірки все ще є гладкою функцією даних.

Є кілька неофіційних коментарів у Mammen, що гладкість необхідна:

Як правило, локальна асимптотична лінійність, здається, необхідна для послідовності завантажувальної програми

Цитування:

van Zwet, W (1989). Розмова на конференції "Асимптотичні методи комп'ютерних інтенсивних процедур статистики" в Ольбервольфах.

Але я не можу знайти жодних слідів цієї розмови окрім кількох цитат.


1
Відмінна тема. Чи правильно, що всі цитовані результати є асимптотичними для розмірів вибірки, що йде до нескінченності?
Майкл М

3
@Michael Дякую і так, все так само асимптотично, як . Між іншим, є нещодавня робота з результатами для кінцевих зразків (наприклад, arxiv.org/pdf/1212.6906.pdf ), але це дуже технічно. n
Орізон

1
Складна тема. Деякі кажуть, що завантажувальна програма взагалі не працює . van Zwer et al. говорить, що треба бути обережним, що завантажено . Я думаю, що треба встановити, що потрібно завантажувати, а що не спочатку завантажувати, перш ніж гарантувати подальше тестування.
Карл

Тепер я оновив відповідь у відповідь на коментар Mammen, сподіваюся, що ще більше роз'яснить вашу сум'яття. А якщо хочете, ви можете трохи пояснити програму, яка спонукає вас запитати про необхідність. Це допоможе мені покращити свою відповідь.
Генрі.L

Відповіді:


12

(1) Чому кількісні оцінки не є диференційованими за Фреше, але їх оцінка завантаження все ще є послідовною?

Вам потрібна диференціальність Адамара (або компактна диференційованість залежно від вашого базового джерела) як достатня умова, щоб зробити завантажувальну роботу в цьому випадку медіаною та будь-яким квантилем Хадамард диференційованим. Дифференцируемость фрешем занадто сильна в більшості застосувань.

Оскільки зазвичай достатньо обговорити польський простір, там ви хочете, щоб локально-лінійний функціонал застосував типовий аргумент компактності, щоб розширити результат узгодженості до глобальної ситуації. Також дивіться коментар до лінеаризації нижче.

Теорема 2.27 [Васермана] дасть вам інтуїцію, як похідне Адамара є слабшим поняттям. А теореми 3.6 та 3.7 [Шао і Ту] дадуть достатню умову для слабкої узгодженості з точки зору -гадамарської диференційованості статистичного функціоналу з розміром спостереження .T n nρTnn

(2) Що впливатиме на послідовність оцінки завантажувачів?

[Shao & Tu] стор.85-86 ілюструє ситуації, коли може виникати невідповідність оцінювачів завантажувальної програми.

(1) самозавантаження чутливі до хвостового поведінки населення . Послідовність вимагає моментних умов, які є більш жорсткими, ніж необхідні для існування межі .H B O O T H 0FHBOOTH0

(2) Оцінювач узгодженості завантажувального інструменту вимагає певної ступеня гладкості від даної статистичної (функціональної) .Tn

(3) Поведінка оцінки завантажувача іноді залежить від методу, який використовується для отримання даних завантажувальної програми.

А в розділі 3.5.2 [Шао & Tu] вони знову приклад квантиля з допомогою згладжує ядра . Зауважте, що моменти є лінійними функціоналами, цитата у вашому запитанні "Типово локальна асимптотична лінійність, здається, необхідна для послідовності завантажувальної програми", вимагає певного рівня аналітичності функціоналу, який може бути необхідним, тому що якщо це не вдасться, ви можете створити певний патологічний випадок як функція Weierstrass (яка є безперервною, але ніде не можна диференціювати).K

(3) Чому локальна лінійність здається необхідною для забезпечення послідовності оцінки завантажувача?

Щодо коментаря "Типово локальна асимптотична лінійність, мабуть, необхідна для послідовності завантажувального завантаження", зробленого Mammen, як ви згадували. Коментар від [Shao & Tu] стор.78 наступний, оскільки вони коментують, що (глобальна) лінеаризація - це лише техніка, яка полегшує доказ послідовності та не вказує на необхідність:

Лінеаризація - ще одна важлива методика доведення послідовності оцінювачів завантажувальної програми, оскільки результати лінійної статистики часто доступні або можуть бути встановлені за допомогою раніше введених методик. Припустимо, що дану статистичну Tn можна наблизити лінійною випадковою змінною (де - лінійна статистика в ), тобто (3.19) Нехай і - аналоги завантажувальної програми та відповідно на основі зразка завантажувальної програмиZn¯=1ni=1nϕ(Xn)ϕ(X)XTn

Tn=θ+Zn¯+oP(1n)
TnZn¯TnZn¯{X1,,Xn} . Якщо ми можемо встановити результат для аналогічного (3.19), тобто (3.20) тоді межа (де - значення параметра) те саме, що і Таким чином, ми звели проблему до проблеми, пов’язаної з " середнє значення" , чий оцінювач розподілу завантажувальної програми може бути показаний відповідним за допомогою методів у розділах 3.1.2-3.1.4.Tn
Tn=θ+Zn¯+oP(1n)
HBOOT(x)xP{=P{n(TnTn)x} ¯ Z nP{n(Zn¯Zn¯)x}Zn¯

І вони навели приклад 3.3 отримання консистенції завантажувальної системи для завантажувального типу типу MLE. Однак якщо глобальна лінійність ефективна таким чином, важко уявити, як можна було б довести послідовність без локальної лінійності. Тож я здогадуюсь, що Маммен хотіла сказати.

(4) Подальші коментарі

Крім обговорення, поданого вище [Shao & Tu], я думаю, що ви хочете - це умова характеристики послідовності оцінювачів завантажувальної програми.

На жаль, я не знаю однієї характеристики послідовності оцінки завантажувача для дуже загального класу розподілу в . M(X)Навіть якщо є одиня відчувающовимагає не тільки гладкість. Але існує характеристика для певного класу статистичних моделей, таких яккласв [Gine & Zinn]; або звичайно компактно підтримуваний клас (безпосередньо з вищезгаданої дискусії), визначений у польському просторі.CLTTCLT

Плюс відстань Колмогорова-Смірнова, на мій смак, - неправильна відстань, якщо наша увага - класична асимптотика (на відміну від «рівномірної» асимптотики для емпіричних процесів). Оскільки відстань KS не викликає слабку топологію, яка є природним підґрунтям для вивчення асимптотичної поведінки, слабка топологія на просторі індукується обмеженою відстані Ліпшіца (АБО відстань Прохорова-Леві), прийнятої [Губер] та багато інших авторів, коли фокус не є емпіричним процесом. Іноді обговорення обмеження поведінки емпіричного процесу також передбачає відстань BL, як [Gine & Zinn].M(X)

Я ненавиджу бути цинічним, але я все ще вважаю, що це не єдина статистика, яка "цитує недійсність". Сказавши це, я просто вважаю, що цитування розмови Ван Цвета є дуже безвідповідальним, хоча Ван Цвет є чудовим науковцем.

Довідка

[Васерман] Васерман, Ларрі. Вся непараметрична статистика, Спрингер, 2010.

[Шао і Ту] Шао, Джун і Дуншенг Ту. Жак-нож і черевик. Спрингер, 1995.

[Gine & Zinn] Giné, Evarist та Joel Zinn. "Запуск загальних емпіричних заходів". Аннали ймовірності (1990): 851-869.

[Хубер] Хубер, Пітер Дж. Міцна статистика. Wiley, 1985.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.