Рішення для використання 2.2a.16 "Надійна статистика: підхід, заснований на функціях впливу"


9

На сторінці 180 надійної статистики: підхід, заснований на функціях впливу, знаходимо таке питання:

  • 16: Покажіть, що для інваріантних оцінок розташування завжди . Знайдіть відповідну верхню межу точки кінцевої вибірки обох випадках, коли непарне або парне.ε12εnnn

Друга частина (після періоду) насправді тривіальна (з огляду на першу), але я не можу знайти спосіб довести першу частину (речення) питання.

У розділі книги, що стосується цього питання, можна знайти (p98):

Визначення 2: Точка зриву кінцевої вибірки оцінювача на вибірці задається:εnTn(xl,,xn)

εn(Tn;xi,,xn):=1nmax{m:maxi1,,imsupy1,,ym|Tn(z1,,zn)|<}

де вибірку (z1,,zn) отримують шляхом заміни m точок даних xi1,,xim на довільні значення y1,,ym.

Саме формальне визначення працює майже на сторінці, але може розглядатися як Хоча явно не визначено, одна можемо здогадатися, що інваріантна локація означає, що повинен задовольняти ε

ε=limнεн
Тн
Тн(х1,,хн)=Тн(х1+c,,хн+c), для усіх cR

Я (спробуйте) відповідаю на питання Уубера в коментарі нижче. У книзі визначено оцінювач - це кілька сторінок, починаючи з p82, я намагаюся відтворити основні частини (я думаю, це відповість на запитання Ваубера):Тн

Припустимо, у нас є одновимірні спостереження які є незалежними та однаково розподіленими (iid). Спостереження належать до деякого зразкового простору , який є підмножиною реальної лінії (часто просто дорівнює , тому спостереження може приймати будь-яке значення ). Параметрична модель складається з сімейства розподілів ймовірностей на вибірковому просторі, де невідомий параметр належить до деякого простору параметрів(Х1,,Хн)НRНRЖθθΘ

...

Ми ідентифікуємо вибірку з її емпіричним розподілом , ігноруючи послідовність спостережень (як це майже завжди робиться). Формально , задається , де , є точкова маса 1 в . В якості оцінювачів ми розглядаємо статистику зі значеннями . У більш широкому сенсі оцінювач може розглядатися як послідовність статистики , по одній для кожного можливого розміру вибірки . В ідеалі спостереження проходять відповідно до члена параметричної моделі (Х1,,Хн)ГнГн(1/н)i=1нΔхiΔХХθТн=Тн(Х1,,Хн)=Тн(Гн){Тн,н1}н{Жθ;θΘ} , але клас усіх можливих розподілів ймовірностей на набагато більший.Ж(Н)Н

Ми розглядаємо оцінки, які є функціоналами [т. для всіх і ] або можуть асимптотично бути замінені функціоналами. Це означає, що ми припускаємо, що існує функціональний [де домен - це набір усіх розподілів для якого визначено ] таким, що вірогідною, коли спостереження виявляються відповідно до справжнього розподілу у . Ми говоримо, щоТн(Гн)=Т(Гн)нГнТ:домен(Т)RТЖ(Н)Т

Тн(Х1,,Хн)нТ(Г)
Гдомен(Т)Т(Г)це асимптотическое значення на .{Тн;н1}Г

...

У цьому розділі ми завжди припускаємо, що досліджувані функціонали відповідають Фішеру (Kallianpur and Rao, 1955): що означає, що при модель оцінювача асимптотично вимірює потрібну величину. Поняття консистенції Фішера є більш підходящим і елегантним для функціоналу, ніж звичайна консистенція або асимптотична неупередженість.

Т(Жθ)=θ для усіх θΘ
{Тн;н1}


1
Як саме ця книга визначає "оцінювач"? Мені здається, що будь-який обмежений оцінювач повинен мати точку зриву , тому, безумовно, він встановлює якісь особливі обмеження на ; і завжди існують обмежені оцінки інваріантних локацій (вони включатимуть константи). Тн1Тн
whuber

1
Дякую за розгорнутий матеріал. Здається, існує багато протилежних прикладів. Простий - це постійний оцінювач для однопараметричного сімейства нормальних розподілів дисперсії . Це локально-інваріантний оцінювач дисперсії. Точка його зриву дорівнює . Це Fisher послідовно (тривіально), але мені потрібно уважно трактувати визначення: " " не може обов'язково посилатися на всі параметри, тому що жоден інваріантний локатор не може бути послідовним! Tn(X1,,Xn)=111θ
whuber

@whuber: Дякую, я розумію ваш зустрічний приклад. Думаю, я
зв’яжусь

Відповіді:


4

Старіші статистичні книги використовували "інваріант" дещо іншим чином, ніж можна було очікувати; зберігається неоднозначна термінологія. Більш сучасний еквівалент - "еквівалент" (див. Посилання в кінці цієї публікації). У сучасному контексті це означає

Tn(X1+c,X2+c,,Xn+c)=Tn(X1,X2,,Xn)+c

для всіх реальних .c

Тоді, щоб вирішити питання, припустимо, що має властивість, що для достатньо великого , все дійсне , і все ,Tnncmεn

|Tn(X+Y)Tn(X)|=o(|c|)

кожного разу, коли відрізняється від максимум в максимум координатах.YXcm

(Це слабша умова, ніж передбачається у визначенні межі розбиття. Насправді, все, що ми насправді потрібно припустити, це те, що коли достатньо велике, вираз " " є деяким значенням, яке гарантується меншим, ніж розмір.)no(|c|)|c|/2

Доказ - протиріччя. Припустимо, відповідно, що цей також еквівалентний, і припустимо, . Тоді для досить великих , є цілим числом, для якого обидва і . Для будь-яких дійсних чисел визначтеTnε>1/2nm(n)=εnm(n)/nε(nm(n))/nεa,b

tn(a,b)=Tn(a,a,,a, b,b,,b)

де є 's та ' s. Змінюючи або меншу кількість координат, ми робимо обидвіm(n) anm(n) bm(n)

|t(a,b)t(0,b)|=o(|a|)

і

|t(a,b)t(a,0)|=o(|b|).

Для стверджується нерівність трикутникаc>0

c=|tn(c,c)tn(0,0)||tn(c,c)tn(c,0)|+|tn(c,0)tn(0,0)|=o(c)+o(c)<c/2+c/2=c

Сувора нерівність на передостанній лінії гарантується для досить великих . Протиріччя, з якого випливає, , доводитьnc<cε1/2.


Список літератури

Е. Л. Леманн, Теорія оцінки точок . Джон Вілі 1983.

У тексті (глава 3, розділ 1) та супровідній виносці пише Леман

Оцінювач, що задовольняє для всіх буде називатися еквівалентним ...δ(X1+a,,Xn+a)=δ(X1,,Xn)+aa

Деякі автори називають таких оцінювачів "інваріантними". Оскільки це дозволяє припустити, що оцінювач залишається незмінним при , здається, бажано резервувати цей термін для функцій, що задовольняють для всіх .Xi=Xi+au(x+a)=u(x)x,a


1
так, я вчора зв’язався з головним автором книги з тим самим запитанням про власне визначення використовуваної інваріантності (я подивився в індексі, і не знайшов його явного в книзі). Я висловився за те, що вважаю, що ваша відповідь є правильною, але я дам автору пару днів, щоб бути впевненим, перш ніж прийняти її.
user603

1
Я не отримав відповіді від автора, але наведені вище аргументи (у відповіді та коментарі) переконали мене, що це справді має бути правильне тлумачення проблеми.
user603
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.