Велика асимптотика зразка / теорія - Чому варто піклуватися?


13

Я сподіваюсь, що це питання не буде позначене "як занадто загальне" і сподіваюся, що розпочнеться дискусія, яка користь усім.

У статистиці ми витрачаємо багато часу, вивчаючи великі вибіркові теорії. Ми глибоко зацікавлені в оцінці асимптотичних властивостей наших оцінювачів, включаючи, чи є вони асимптотично неупередженими, асимптотично ефективними, їх асимптотичним розподілом тощо. Слово асимптотика сильно пов'язане з припущенням, що n .

У дійсності, однак, ми завжди маємо справу з кінцевою n . Мої запитання:

1) що ми маємо на увазі під великою вибіркою? Як ми можемо розрізнити малі та великі зразки?

2) Коли ми говоримо n , чи ми буквально маємо на увазі, що n має йти до ?

Наприклад, для біноміального розподілу X¯ потрібно приблизно n = 30, щоб перейти до нормального розподілу за CLT. Якщо ми маємо n або в даному випадку під ми маємо на увазі 30 або більше ?!

3) Припустимо, у нас є кінцевий зразок і припустимо, що ми знаємо все про асимптотичну поведінку наших оцінювачів. І що? припустимо, що наші оцінки є асимптотично неупередженими, то чи є у нас об'єктивна оцінка для нашого параметра, що цікавить наш кінцевий зразок, чи це означає, що якби у нас було n , тоді у нас був би неупереджений?

Як ви можете бачити з вищезазначених питань, я намагаюся зрозуміти філософію "Асимптотики великих зразків" і дізнатися, чому нас хвилює? Мені потрібно отримати інтуїцію для теорем, які я вивчаю.


5
Поведінка з великим зразком - це один із способів показати, що даний оцінювач працює, або що б там не було, в межах нескінченних даних. Ви маєте рацію, що це не обов'язково говорить нам нічого про те, наскільки хороший оцінювач на практиці, але це перший крок: ви навряд чи захочете використовувати оцінювач, який не є асимптотично послідовним (або будь-яким іншим). Перевага асимптотичного аналізу полягає в тому, що це часто простіше зрозуміти, ніж кінцевий зразок.
Дугал

sinx=x

1
n>30p=0.001n=30nmin(p,1p)>15

Відповіді:


6

Краще пізно, ніж ніколи. Дозвольте спершу перерахувати три (я вважаю важливими) причини, чому ми зосереджуємось на асимптотичній неупередженості (послідовності) оцінювачів.

а) Послідовність є мінімальним критерієм. Якщо оцінювач неправильно не оцінює навіть з великою кількістю даних, то яка користь? Це обгрунтування, наведене в Wooldridge: Вступна економетрія.

б) Кінцеві властивості вибірки набагато важче довести (а точніше, асимптотичні твердження простіші). Зараз я сам займаюся деякими дослідженнями, і кожного разу, коли ви можете покластися на великі зразки інструментів, все стає набагато простіше. Закони великої кількості, теореми конвергенції мартінгейла тощо - хороший інструмент для отримання асимптотичних результатів, але не допомагають з кінцевими зразками. Я вважаю, що щось з цього приводу згадується в Hayashi (2000): Економетрія.

c) Якщо оцінювачі є упередженими для малих вибірок, їх можна потенційно виправити або принаймні покращити за допомогою так званих невеликих виправлень вибірок. Вони часто теоретично ускладнюються (щоб довести, що вони покращуються на оцінці без виправлення). Крім того, більшість людей добре покладаються на великі вибірки, тому невеликі виправлення вибірки часто не застосовуються у стандартному програмному забезпеченні статистики, тому що лише деякі люди вимагають їх (ті, хто не може отримати більше даних І дбають про неупередженість). Таким чином, існують певні перешкоди для використання цих незвичайних виправлень.

На ваші запитання. Що ми маємо на увазі під «великим зразком»? Це сильно залежить від контексту, і для конкретних інструментів на нього можна відповісти за допомогою моделювання. Тобто ви штучно генеруєте дані і бачите, як, скажімо, швидкість відхилення поводиться як функція розміру вибірки, або зміщення поводиться як функція розміру вибірки. Конкретний приклад наводимо тут , де автори бачать, скільки кластерів потребує стандартних помилок з кластером OLS, блокують стандартні помилки завантаження тощо. Деякі теоретики також мають твердження про швидкість конвергенції, але для практичних цілей моделювання виглядає більш інформативним.

Чи дійсно потрібно ? Якщо це говорить теорія, так, але в застосуванні ми можемо прийняти невеликі, незначні зміщення, які ми маємо з досить великими розмірами вибірки з високою ймовірністю. Що достатньо означає, залежить від контексту, дивіться вище.n

Питання 3: Зазвичай питання про неупередженість (для всіх розмірів вибірки) та консистенції (неупередженість для великих зразків) розглядається окремо. Оцінювач може бути упередженим, але послідовним, і тоді дійсно лише великі вибіркові оцінки є неупередженими. Але є також неупереджені та послідовні оцінки, які теоретично застосовні для будь-якого розміру вибірки. ( Оцінювач також може бути неупередженим, але неузгодженим з технічних причин. )

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.