Яка інтуїція стоїть за визначенням повноти в статистиці як такої, що неможливо сформувати з неї об'єктивний оцінювач ?


21

У класичній статистиці існує визначення, що статистичний набору даних визначений як повний для параметра , неможливо сформувати з нього непідвладне оцінювач нетривіально. Тобто єдиний спосіб мати для всіх - це бути майже точно.Ty1,,ynθ0Eh(T(y))=0θh0

Чи є за цим інтуїція? Це здається досить механічним способом визначення цього, я усвідомлюю, що про це просили і раніше, але мені було цікаво, чи існує дуже легка для розуміння інтуїція, яка допоможе студентам-початківцям легше перетравити матеріал.


2
Це дуже гарне запитання, мені довелося самому в цьому копатися. Виявляється, причина такої механічної дефініції і не здається інтуїтивно значущою для такого практичного лікаря, як я, в тому, що вона в першу чергу використовується для доказу фундаментальних внесків у математичній статистиці. Зокрема, мій короткий пошук виявив, що теорема Леманна-Шеффе та теорема Басу потребують повноти статистики для того, щоб дотримуватися. Це внески середини 1950-х. Я не можу запропонувати вам інтуїтивного пояснення - але якщо ви дійсно хочете побудувати його, можливо, доказівник
Jeremias K

Відповіді:


18

Я спробую додати до іншої відповіді. По-перше, повнота - це технічний стан, який в основному виправдовується теоремами, які його використовують. Тож почнемо з деяких суміжних понять і теорем, де вони виникають.

Нехай являє собою вектор iid даних, який ми як розподіл де параметр управляє даними невідомо. є достатнім , якщо умовний розподіл не залежить від параметра . є допоміжним, якщо розподіл не залежить від (всередині сімейства ). - об'єктивний оцінювач нуля, якщо його очікування дорівнює нулю, незалежно відX=(X1,X2,,Xn)f(x;θ),θΘθT=T(X)X T θ V = V ( X ) V θ f ( x ; θ ) U = U ( X ) θ S = S ( XXTθV=V(X)Vθf(x;θ)U=U(X)θ . - повна статистика, якщо будь-який об'єктивний оцінювач нуля на основі однаково нульовий, тобто якщо то ae (для всіх ).S=S(X)S E g ( S ) = 0 ( для всіх  θ ) g ( S ) = 0 θSEg(S)=0(for all θ)g(S)=0θ

Тепер, припустимо, у вас є два різних об'єктивних оцінювача на основі достатньої статистики , . Тобто в символах і (для всіх ). Тоді - це неупереджений оцінювач нуля, який не є тотожним нулем, доводячи, що не є повним. Отже, повнота достатньої статистичної дає нам змогу існувати лише один унікальний об'єктивний оцінювач на основіθTg1(T),g2(T)

Eg1(T)=θ,Eg2(T)=θ
P(g1(T)g2(T))>0θg1(T)g2(T)TTθT. Це вже дуже близько до теореми Леманна – Шеффе.

Розглянемо деякі приклади. Припустимо, тепер є однаковими на проміжку . Ми можемо показати, що ( - статистика порядку) пара достатня, але вона не повна, тому що різниця є допоміжною, ми можемо обчислити її очікування, нехай це буде (що є лише функцією ), а потімX1,,Xn(θ,θ+1)X(1)<X(2)<<X(n)(X(1),X(n))X(n)X(1)cnX(n)X(1)cθбуде неупередженим оцінником нуля, який не є ідентичним нулем. Тож наша достатня статистика в даному випадку не є повною та достатньою. І ми можемо побачити, що це означає: існують функції достатньої статистики, які не є інформативними щодо (в контексті моделі). Це не може статися з цілком достатньою статистикою; вона в певному сенсі є максимально інформативною, оскільки жодна її функція неінформативна. З іншого боку, якщо є якась функція мінімально достатньої статистики, яка має нуль очікування, це може розглядатися як термін шуму, умови збурення / шуму в моделях мають нульове очікування. Тож можна сказати, що неповна достатня статистика містить певний шум .θ

Подивіться ще раз на діапазон у цьому прикладі. Оскільки його розповсюдження не залежить від , воно само по собі не містить будь-якої інформації про . Але разом із достатньою статистикою це і є! Як? Подивіться на випадок, коли спостерігається Тоді в контексті нашої (як відомо, правдивої) моделі ми маємо досконалі знання ! А саме, ми можемо з упевненістю сказати, що . Ви можете перевірити, що будь-яке інше значення для приводить до абоR=X(n)X(1)θθ R = 1 θ θ = X ( 1 ) θ X ( 1 ) X ( n ) R = 0,1 θθR=1θθ=X(1)θX(1)X(n)будучи неможливим спостереженням за припущеною моделлю. З іншого боку, якщо ми спостерігаємо , то діапазон можливих значень для досить великий (вправа ...). R=0.1θ

У цьому сенсі допоміжна статистика дійсно містить деяку інформацію про точність, з якою ми можемо оцінити на основі цих даних та моделі. У цьому прикладі та інших допоміжна статистика "бере на себе роль розміру вибірки". Зазвичай для довірчих інтервалів і таких потрібен розмір вибірки , але в цьому прикладі ми можемо скласти умовний довірчий інтервал, який обчислюється, використовуючи лише , а не (вправа.) Це була ідея Фішера, про що слід вважати умовивід деяка допоміжна статистика.RθRnR nRn

Тепер теорема Басу: Якщо достатньо повний, то він не залежить від будь-якої допоміжної статистики. Тобто, висновок, заснований на цілком достатній статистиці, простіший, оскільки нам не потрібно вважати умовний умовивід. Умови для незалежної від статистики , звичайно, нічого не змінюють.TT

Потім, останній приклад, щоб дати ще трохи інтуїції. Змініть наш приклад рівномірного розподілу на рівномірний розподіл на інтервалі (з ). У цьому випадку статистика є повною і достатньою. Що змінилося? Ми можемо бачити, що повнота справді є властивістю моделі . У першому випадку у нас був простір з обмеженими параметрами. Це обмеження знищило повноту, ввівши зв'язки зі статистикою замовлень. Видаливши це обмеження, ми отримали повноту! Отже, у певному сенсі відсутність повноти означає, що простір параметрів недостатньо великий, і, збільшивши його, ми можемо сподіватися відновити повноту (і, таким чином, простіше зробити висновок).(θ1,θ2)θ1<θ2(X(1),X(n))

Деякі інші приклади, коли недостатня повнота викликана обмеженнями простору параметрів,

  • дивіться мою відповідь на: Яка інформація - це інформація Фішера?

  • Нехай буде (модель масштабування місця). Тоді статистика замовлень достатня, але не повна. Але тепер збільшити цю модель повністю непараметричної моделі, до сих пір IID , але з деяким повністю невизначеним розподілом . Тоді статистика замовлень достатня і повна. X1,,XnCauchy(θ,σ)F

  • Для експоненціальних сімей з канонічним простором параметрів (тобто якнайбільше) мінімально достатня статистика також є повною. Але в багатьох випадках введення обмежень на простір параметрів, як і у кривих експоненціальних сімей , руйнує повноту.

Дуже актуальною статтею є Інтерпретація повноти та теорема Басу.


7

Певна інтуїція може бути доступна з теорії найкращих (мінімальної дисперсії) неупереджених оцінювачів.

Якщо то - найкращий неупереджений оцінювач iff некорельований з усіма неупередженими оцінками нуля.W τ ( θ ) WEθW=τ(θ)Wτ(θ)W

Доведення : Нехай - неупереджений оцінювач, не пов'язаний зі всіма неупередженими оцінками нуля. Нехай - інший оцінювач, такий що . Запишіть . За припущенням, . Отже, для будь-якого .WWEθW=EθW=τ(θ)W=W+(WW)VarθW=VarθW+Varθ(WW)WVarθWVarθW

Тепер припустимо, що - найкращий об'єктивний оцінювач. Нехай буде якийсь інший оцінювач з . також не є об'єктивним для . У нас Якби було таке , що , ми отримаємо для . Тоді не може бути найкращим об'єктивним оцінювачем. QEDWUEθU=0ϕa:=W+aUτ(θ)

Varθϕa:=VarθW+2aCovθ(W,U)+a2VarθU.
θ0ΘVarθϕa<VarθWa(0,-2Cov θ 0 (W,U)/Var θ 0 U)WCovθ0(W,U)<0Varθϕa<VarθWa(0,2Covθ0(W,U)/Varθ0U)W

Інтуїтивно зрозумілий результат говорить про те, що якщо оцінювач є оптимальним, його не можна вдосконалити, додавши до нього якийсь шум, у сенсі поєднання його з оцінкою, який в середньому дорівнює нулю (будучи неупередженим оцінкою нуля ).

На жаль, важко охарактеризувати всі об'єктивні оцінки нуля. Ситуація стає набагато простішою, якщо нуль сам по собі є єдиним неупередженим нуля, оскільки будь-яка статистика задовольняє . Повнота описує таку ситуацію.C o v θ ( W , 0 ) = 0WCovθ(W,0)=0

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.