Чи є середня вибірка «найкращою» оцінкою середнього розподілу в якомусь сенсі?


10

За (слабким / сильним) законом великих чисел, з огляду на деякі iid-вибіркові точки розподілу, їх вибірка означає сходиться до середнього значення розподілу як вірогідно, так і як розмір вибірки іде до нескінченності.{xiRn,i=1,,N}f({xi,i=1,,N}):=1Ni=1NxiN

Коли розмір вибірки фіксований, мені цікаво, чи оцінювач LLN є оптимізатором, найкращим в якомусь сенсі? Наприклад,Nf

  1. його очікування є середнім показником розподілу, тому це неупереджений оцінювач. Її дисперсія - де - дисперсія розподілу. Але це УМВУ?σ2Nσ2
  2. чи є якась функція така, що розв’яжіть задачу мінімізації:l0:Rn×Rn[0,)f({xi,i=1,,N})

    f({xi,i=1,,N})=argminuRni=1Nl0(xi,u)?

    Іншими словами, f є найкращою функцією контрасту l0 у мінімальній контрастній функції (див. Розділ 2.1 «Основні евристики оцінки» в « Математична статистика: основні ідеї та вибрані теми, Том 1 » Бікл та Доксум).

    Наприклад, якщо відомий / обмежений розподіл із сімейства гауссових розподілів, то середнє значення вибірки буде оцінкою MLE середнього розподілу, а MLE належить до мінімальної рамки контрасту, а його контрастна функція l0 - мінус вірогідність журналу функція.

  3. чи є якась функція така, що вирішує задачу мінімізації: для будь-якого розподілу з в межах деякого сімейства розподілів?f f = argmin fl:Rn×F[0,)fP x i F

    f=argminfEiid {xi,i=1,,N} each with distribution Pl(f({xi,i=1,,N}),P)?
    PxiF

    Іншими словами, є найкращим wrt деякою втраченою функцією та деякою сімейкою розподілів у теоретичній рамці прийняття рішень (див. Розділ 1.3 "Теоретичні рамки прийняття рішень" у " Математичній статистиці: основні ідеї та вибрані теми, Том 1 " by Бікл та Доксум). l FflF

Зауважте, що вище - це три різні інтерпретації для "найкращої" оцінки, яку я знав дотепер. Якщо ви знаєте про інші можливі тлумачення, які можуть застосовуватися до оцінювача LLN, будь ласка, не соромтесь також згадати це.


Інший спосіб охарактеризувати оцінювач: Будь ласка , прочитайте про Consistent оцінювач тут . Зразок середньої вибірки відповідає LLN.
Rohit Banga

1
Вибірка означає, що має багато приємних та цікавих властивостей, але іноді вони не є найкращими, що можна мати у конкретній ситуації. Одним із прикладів є випадки, коли підтримка розподілу залежить від значення параметра. Розглянемо , тоді є неупередженим оцінювачем середнє значення розподілу але це не UMVUE, наприклад, неупереджені оцінки на основі статистики найбільшого порядку матимуть меншу дисперсію, ніж середня вибірка. 1X1,X2,,XnU(0,θ)θn+11ni=1nXiθn+1nX(n)
VitalStatistix

Дякую! Але як обчислюється його дисперсія?
Тім

Pdf , найбільша статистика порядку подається через , тому дисперсія неупередженого оцінювача буде, , тобто дисперсія має порядок порівняно з дисперсією середньої вибірки, яка є порядку . f ( y ) = n y n - 1Y=X(n)n
f(y)=nyn1θn;y(0,θ)
nn+1YVar(nn+1Y)=1n(n+2)θ21n21n
VitalStatistix

@VitalStatistix, я тут зовсім чогось пропускаю? Якщо змінні однакові на середнє значення вибірки має очікування , тож чи не хочете ви помножити на 2, щоб отримати неупереджений оцінювач ? [0,θ]θ/2θ
NRH

Відповіді:


4

Відповідь на ваше друге питання - так: середня вибірка - це оцінка мінімального контрасту, коли ваша функція дорівнює , коли x і u - дійсні числа, або , коли x і u - стовпчикові вектори. Це випливає з теорії найменших квадратів або диференціального числення. l0(xu)2(xu)(xu)

Оцінювач мінімальної контрастності за певних технічних умов одночасно і послідовно, і асимптотично. Для середнього зразка це вже випливає з LLN та центральної граничної теореми. Я не знаю, що мінімальні оцінки контрасту є "оптимальними" в будь-якому випадку. Що приємних оцінювачів мінімальної контрастності є те, що багато надійних оцінювачів (наприклад, медіани, оцінки Губера, вибіркові квантилі) потрапляють до цього сімейства, і ми можемо зробити висновок, що вони послідовні та асимптотично нормальні лише застосовуючи загальну теорему для оцінювачів мінімальної контрастності, так поки ми перевіряємо деякі технічні умови (хоча часто це набагато складніше, ніж це звучить).

Одне поняття оптимальності, яке ви не згадуєте у своєму питанні, - це ефективність, яка, грубо кажучи, стосується того, наскільки великий зразок вам потрібен, щоб отримати оцінку певної якості. Див. Http://en.wikipedia.org/wiki/Efficiency_(statistics)#Asymptotic_ectivity для порівняння ефективності середнього та медіанного (середнє значення є більш ефективним, але медіана є більш стійкою для людей, що втрачають лих).

По третьому питанню, без обмежень щодо набору функцій f, над якими ви знаходите аргмін, я не думаю, що значення вибірки буде оптимальним. Для будь-якого розподілу P ви можете зафіксувати f як константу, яка ігнорує 'і мінімізує втрати для конкретного P. Середнє значення вибірки не може перемогти це.xi

Оптимальність Minimax є слабшою умовою, ніж та, яку ви даєте: замість того, щоб просити, щоб була найкращою функцією для будь-якого класу, ви можете попросити, щоб мав найкращі показники в гіршому випадку. Тобто між аргміном та очікуванням, поставленим в . Байєсівський оптимальність інший підхід: поставити апріорне розподіл на , і взяти на себе очікування над , а також проби з . P f max P F P FfPfmaxPFPFPPP


Дякую! Чи є хороші посилання на властивості оцінювача мінімальної контрастності, такі як послідовний і асимптотично нормальний, а також такі приклади, як медіана, оцінки Губера, квантові вибірки?
Тім

Розділ 5.2.2 книги, що ви цитуєте Bickel & Doksum, має теорему про узгодженість оцінок мінімальної контрастності. Розділ 5.4.2 обговорює асимптотичну нормальність. Ще одне джерело, яке я рекомендую, і яке обговорює інші оцінки, про які я згадую, - це книга про асимптотику статистики ван дер Ваарта . У главі 5 йдеться про М-оцінки, що є його ім'ям для мінімальних оцінок контрасту.
DavidR

Дякую! Чи є норма у вашому першому абзаці довільною у чи повинна бути норма? l 2Rnl2
Тім

Я маю на увазі стандартну евклідову норму - я змінив її на векторну позначення, щоб уточнити.
DavidR

DavidR, дякую! (1) Що стосується частини 3 мого допису, мені цікаво, чи може середня вибірка, тобто оцінка LLN, вміститися в теоретичну рамку прийняття рішення щодо деякої функції втрат ? (2) У мене складається враження, що всі оцінки, такі як MLE та Least Square Estimator, вписуються в рамки мінімальної контрастності, але не в теоретичну основу рішення. Тож чи теоретичні рамки прийняття рішення не використовуються для побудови оцінювачів, а лише для їх оцінки? l
Тім
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.