Краще пізно, ніж ніколи. Дозвольте спершу перерахувати три (я вважаю важливими) причини, чому ми зосереджуємось на асимптотичній неупередженості (послідовності) оцінювачів.
а) Послідовність є мінімальним критерієм. Якщо оцінювач неправильно не оцінює навіть з великою кількістю даних, то яка користь? Це обгрунтування, наведене в Wooldridge: Вступна економетрія.
б) Кінцеві властивості вибірки набагато важче довести (а точніше, асимптотичні твердження простіші). Зараз я сам займаюся деякими дослідженнями, і кожного разу, коли ви можете покластися на великі зразки інструментів, все стає набагато простіше. Закони великої кількості, теореми конвергенції мартінгейла тощо - хороший інструмент для отримання асимптотичних результатів, але не допомагають з кінцевими зразками. Я вважаю, що щось з цього приводу згадується в Hayashi (2000): Економетрія.
c) Якщо оцінювачі є упередженими для малих вибірок, їх можна потенційно виправити або принаймні покращити за допомогою так званих невеликих виправлень вибірок. Вони часто теоретично ускладнюються (щоб довести, що вони покращуються на оцінці без виправлення). Крім того, більшість людей добре покладаються на великі вибірки, тому невеликі виправлення вибірки часто не застосовуються у стандартному програмному забезпеченні статистики, тому що лише деякі люди вимагають їх (ті, хто не може отримати більше даних І дбають про неупередженість). Таким чином, існують певні перешкоди для використання цих незвичайних виправлень.
На ваші запитання. Що ми маємо на увазі під «великим зразком»? Це сильно залежить від контексту, і для конкретних інструментів на нього можна відповісти за допомогою моделювання. Тобто ви штучно генеруєте дані і бачите, як, скажімо, швидкість відхилення поводиться як функція розміру вибірки, або зміщення поводиться як функція розміру вибірки. Конкретний приклад наводимо тут , де автори бачать, скільки кластерів потребує стандартних помилок з кластером OLS, блокують стандартні помилки завантаження тощо. Деякі теоретики також мають твердження про швидкість конвергенції, але для практичних цілей моделювання виглядає більш інформативним.
Чи дійсно потрібно ? Якщо це говорить теорія, так, але в застосуванні ми можемо прийняти невеликі, незначні зміщення, які ми маємо з досить великими розмірами вибірки з високою ймовірністю. Що достатньо означає, залежить від контексту, дивіться вище.n→∞
Питання 3: Зазвичай питання про неупередженість (для всіх розмірів вибірки) та консистенції (неупередженість для великих зразків) розглядається окремо. Оцінювач може бути упередженим, але послідовним, і тоді дійсно лише великі вибіркові оцінки є неупередженими. Але є також неупереджені та послідовні оцінки, які теоретично застосовні для будь-якого розміру вибірки. ( Оцінювач також може бути неупередженим, але неузгодженим з технічних причин. )