Якщо кількість зацікавлених сторін, як правило, функціонал дистрибуції, є досить рівною, а ваші дані - це, як правило, ви перебуваєте на досить безпечній території. Звичайно, є й інші обставини, коли завантажувальна програма також буде працювати.
Що означає завантажувальний засіб "провалити"
Загалом, мета завантажувальної програми - побудувати приблизний розподіл вибірки для статистики, що цікавить. Йдеться не про фактичну оцінку параметра. Отже, якщо статистика, що представляє інтерес (за деяким масштабуванням та центруванням), є та у розподілі, ми хотіли б, щоб наш розподіл завантажувального сходяться до розподілу . Якщо у нас цього немає, то ми не можемо довіряти зробленим висновкам.X^nX^n→X∞X∞
Канонічний приклад , коли самозавантаження можуть зазнати невдачі, навіть в н.о.р. каркаса при спробі наблизити розподіл вибірки екстремальної статистики порядку. Нижче коротке обговорення.
Максимальний порядок статистики випадкової вибірки з РозподілU[0,θ]
Нехай є послідовністю iid однорідних випадкових величин на . Нехай . Розподіл є
(Зауважте, що дуже простим аргументом це фактично також показує, що вірогідно, і навіть, майже напевно , якщо всі випадкові величини визначені в одному просторі.)X1,X2,…[0,θ]X(n)=max1≤k≤nXkX(n)
P(X(n)≤x)=(x/θ)n.
X(n)→θ
Елементарний обчислення дає
або, іншими словами, переходить в розподілі до експоненціальної випадкової величини із середнім .
P(n(θ−X(n))≤x)=1−(1−xθn)n→1−e−x/θ,
n(θ−X(n))θ
Тепер формуємо (наївну) завантажувальну оцінку розподілу шляхом перекомпонування із заміною, щоб отримати і використовуючи розподіл з залежать від .n(θ−X(n))X1,…,XnX⋆1,…,X⋆nn(X(n)−X⋆(n))X1,…,Xn
Але зауважте, що з вірогідністю , і тому розподіл завантажувальної стрічки має точкову масу в нулі навіть асимптотично, незважаючи на той факт, що фактичний обмежувальний розподіл є безперервним.X⋆(n)=X(n)1−(1−1/n)n→1−e−1
Більш чітко, хоча справжній обмежувальний розподіл є експоненціальним із середнім , обмежуючий розподіл завантажувальної програми розміщує точкову масу під нулем розміром незалежно від фактичного значення . Беручи достатньо великим, ми можемо зробити ймовірність справжнього обмеження розподілу довільною малою для будь-якого фіксованого інтервалу , але завантажувальна програма ( все-таки !) Повідомляє, що в цьому інтервалі є хоча б 0,632 ймовірність! З цього повинно бути зрозуміло, що завантажувальна машина може вести себе довільно погано в цій обстановці.θ1−e−1≈0.632 θθ[0,ε)
Підсумовуючи це, завантажувальний пристрій в цьому випадку виходить з ладу (нещасно). Якщо справа стосується параметрів на краю простору параметрів, то, як правило, йде не так.
Приклад з вибірки нормальних випадкових величин
Є й інші подібні приклади виходу з ладу завантажувального пристрою в дивно простих обставинах.
Розглянемо зразок з де простір параметрів для обмежений . MLE в цьому випадку - . Знову ми використовуємо оцінку завантаження . Знову ж таки, можна показати, що розподіл (умовний на спостережуваному зразку) не збігається з тим самим обмежуючим розподілом, що і .X1,X2,…N(μ,1)μ[0,∞)X^n=max(X¯,0)X^⋆n=max(X¯⋆,0)n−−√(X^⋆n−X^n)n−−√(X^n−μ)
Обмінні масиви
Мабуть, один із найдраматичніших прикладів - це обмінний масив. Нехай - масив випадкових змінних, такий, що для кожної пари матриць перестановки і масиви і мають однаковий спільний розподіл. Тобто, permuting рядки та стовпці зберігають розподіл інваріантним. (Як приклад можна придумати двосторонню модель випадкових ефектів з одним спостереженням на клітинку, хоча модель є набагато більш загальною.)Y=(Yij)PQYPYQY
Припустимо, ми хочемо оцінити інтервал довіри для середнього (через припущення про обмінність, описане вище про засоби всіх комірки повинні бути однаковими).μ=E(Yij)=E(Y11)
Мак-Каллаг (2000) розглядав два різні природні (тобто наївні) способи завантаження такого масиву. Жодна з них не отримує асимптотичну дисперсію для середньої вибірки правильною. Він також розглядає деякі приклади однобічного обмінного масиву та лінійної регресії.
Список літератури
На жаль, тема нетривіальна, тому жодне з них не читається особливо легко.
П. Бікель та Д. Фрідман, Деякі асимптотичні теорії для завантажувальної машини . Енн. Стат. , т. 9, ні. 6 (1981), 1196–1217.
DWK Andrews, Невідповідність завантажувальної стрічки, коли параметр знаходиться на межі простору параметрів , Econometrica , vol. 68, ні. 2 (2000), 399–405.
P. McCullagh, Resampling та змінний масив , Bernoulli , vol. 6, ні. 2 (2000), 285–301.
Е. Л. Леманн та JP Романо, Тестування статистичних гіпотез , 3-е. ред., Спрингер (2005). [Глава 15: Загальні методи великих зразків]