Я спробую додати до іншої відповіді. По-перше, повнота - це технічний стан, який в основному виправдовується теоремами, які його використовують. Тож почнемо з деяких суміжних понять і теорем, де вони виникають.
Нехай являє собою вектор iid даних, який ми як розподіл де параметр управляє даними невідомо. є достатнім , якщо умовний розподіл не залежить від параметра . є допоміжним, якщо розподіл не залежить від (всередині сімейства ). - об'єктивний оцінювач нуля, якщо його очікування дорівнює нулю, незалежно відX=(X1,X2,…,Xn)f(x;θ),θ∈ΘθT=T(X)X ∣ T θ V = V ( X ) V θ f ( x ; θ ) U = U ( X ) θ S = S ( XX∣TθV=V(X)Vθf(x;θ)U=U(X)θ . - повна статистика, якщо будь-який об'єктивний оцінювач нуля на основі однаково нульовий, тобто якщо то ae (для всіх ).S=S(X)S E g ( S ) = 0 ( для всіх θ ) g ( S ) = 0 θSEg(S)=0(for all θ)g(S)=0θ
Тепер, припустимо, у вас є два різних об'єктивних оцінювача на основі достатньої статистики , . Тобто в символах
і (для всіх ). Тоді - це неупереджений оцінювач нуля, який не є тотожним нулем, доводячи, що не є повним. Отже, повнота достатньої статистичної дає нам змогу існувати лише один унікальний об'єктивний оцінювач на основіθTg1(T),g2(T)Eg1(T)=θ,Eg2(T)=θ
P(g1(T)≠g2(T))>0θg1(T)−g2(T)TTθT. Це вже дуже близько до теореми Леманна – Шеффе.
Розглянемо деякі приклади. Припустимо, тепер є однаковими на проміжку . Ми можемо показати, що ( - статистика порядку) пара достатня, але вона не повна, тому що різниця є допоміжною, ми можемо обчислити її очікування, нехай це буде (що є лише функцією ), а потімX1,…,Xn(θ,θ+1)X(1)<X(2)<⋯<X(n)(X(1),X(n))X(n)−X(1)cnX(n)−X(1)−cθбуде неупередженим оцінником нуля, який не є ідентичним нулем. Тож наша достатня статистика в даному випадку не є повною та достатньою. І ми можемо побачити, що це означає: існують функції достатньої статистики, які не є інформативними щодо (в контексті моделі). Це не може статися з цілком достатньою статистикою; вона в певному сенсі є максимально інформативною, оскільки жодна її функція неінформативна. З іншого боку, якщо є якась функція мінімально достатньої статистики, яка має нуль очікування, це може розглядатися як термін шуму, умови збурення / шуму в моделях мають нульове очікування. Тож можна сказати, що неповна достатня статистика містить певний шум .θ
Подивіться ще раз на діапазон у цьому прикладі. Оскільки його розповсюдження не залежить від , воно само по собі не містить будь-якої інформації про . Але разом із достатньою статистикою це і є! Як? Подивіться на випадок, коли спостерігається Тоді в контексті нашої (як відомо, правдивої) моделі ми маємо досконалі знання ! А саме, ми можемо з упевненістю сказати, що . Ви можете перевірити, що будь-яке інше значення для приводить до абоR=X(n)−X(1)θθ R = 1 θ θ = X ( 1 ) θ X ( 1 ) X ( n ) R = 0,1 θθR=1θθ=X(1)θX(1)X(n)будучи неможливим спостереженням за припущеною моделлю. З іншого боку, якщо ми спостерігаємо , то діапазон можливих значень для досить великий (вправа ...). R=0.1θ
У цьому сенсі допоміжна статистика дійсно містить деяку інформацію про точність, з якою ми можемо оцінити на основі цих даних та моделі. У цьому прикладі та інших допоміжна статистика "бере на себе роль розміру вибірки". Зазвичай для довірчих інтервалів і таких потрібен розмір вибірки , але в цьому прикладі ми можемо скласти умовний довірчий інтервал, який обчислюється, використовуючи лише , а не (вправа.) Це була ідея Фішера, про що слід вважати умовивід деяка допоміжна статистика.RθRnR nRn
Тепер теорема Басу: Якщо достатньо повний, то він не залежить від будь-якої допоміжної статистики. Тобто, висновок, заснований на цілком достатній статистиці, простіший, оскільки нам не потрібно вважати умовний умовивід. Умови для незалежної від статистики , звичайно, нічого не змінюють.TT
Потім, останній приклад, щоб дати ще трохи інтуїції. Змініть наш приклад рівномірного розподілу на рівномірний розподіл на інтервалі (з ). У цьому випадку статистика є повною і достатньою. Що змінилося? Ми можемо бачити, що повнота справді є властивістю моделі . У першому випадку у нас був простір з обмеженими параметрами. Це обмеження знищило повноту, ввівши зв'язки зі статистикою замовлень. Видаливши це обмеження, ми отримали повноту! Отже, у певному сенсі відсутність повноти означає, що простір параметрів недостатньо великий, і, збільшивши його, ми можемо сподіватися відновити повноту (і, таким чином, простіше зробити висновок).(θ1,θ2)θ1<θ2(X(1),X(n))
Деякі інші приклади, коли недостатня повнота викликана обмеженнями простору параметрів,
дивіться мою відповідь на: Яка інформація - це інформація Фішера?
Нехай буде (модель масштабування місця). Тоді статистика замовлень достатня, але не повна. Але тепер збільшити цю модель повністю непараметричної моделі, до сих пір IID , але з деяким повністю невизначеним розподілом . Тоді статистика замовлень достатня і повна. X1,…,XnCauchy(θ,σ)F
Для експоненціальних сімей з канонічним простором параметрів (тобто якнайбільше) мінімально достатня статистика також є повною. Але в багатьох випадках введення обмежень на простір параметрів, як і у кривих експоненціальних сімей , руйнує повноту.
Дуже актуальною статтею є Інтерпретація повноти та теорема Басу.