Чи можемо ми використовувати зразки завантажувальної програми, менші за оригінальний зразок?


12

Я хочу використовувати завантажувальну програму для оцінки інтервалів довіри для оцінюваних параметрів з набору даних панелі з N = 250 фірмами і T = 50 місяцями. Оцінка параметрів обчислювально дорога (кілька днів обчислень) за рахунок використання фільтрації Кальмана та складної нелінійної оцінки. Тому малювання (із заміною) B (у сотнях і більше) зразків M = N = 250 фірм з оригінальної вибірки та оцінка параметрів B разів обчислювально нездійсненно, хоча це і є основним методом завантаження.

Тому я розглядаю можливість використання менших M (наприклад, 10) для зразків завантажувальної програми (а не повного розміру N = 250), намальованих випадковим чином із заміною оригінальних фірм, а потім масштабувати коваріаційну матрицю коваріантних параметрів моделі з (на прикладі вище на 1/25) для обчислення матриці коваріації для параметрів моделі, оцінених на повній вибірці.1NM

Бажані довірчі інтервали можуть бути потім наближені на основі припущення про нормальність або емпіричні для менших зразків, масштабованих за допомогою аналогічної процедури (наприклад, зменшення на коефіцієнт .1NM

Чи має значення це рішення? Чи є теоретичні результати, щоб це виправдати? Будь-які альтернативи для вирішення цього виклику?

Відповіді:


4

Це питання було задано дуже давно, але я розміщую відповідь у випадку, якщо хтось їх виявить у майбутньому. Коротше кажучи, відповідь "так": ви можете зробити це в багатьох налаштуваннях, і ви виправдані, щоб виправити зміну розміру вибірки за допомогою . Цей підхід зазвичай називають з boostrap, і він працює в більшості налаштувань, які робить `` традиційний '' завантажувальний засіб, а також у деяких настройках, в яких він відсутній.MNMN

Причина полягає в тому, що багато аргументів послідовності завантажувальної програми використовують оцінювачі форми , де - випадкові величини, а - деякий параметр основний розподіл. Наприклад, для середнього зразка та .1N(TNμ)X1,,XNμTN=1Ni=1NXiμ=E(X1)

Багато доказів узгодженості завантажувального аргументу стверджують, що як , даючи деякий кінцевий зразок і пов'язану з ним оцінку , де з справжнього базового розподілу, а намалюються із заміною з .N{x1,,xN}μ^N=TN(x1,,xN)

(1)N(TN(X1,,XN)μ^N)DN(TN(X1,,XN)μ)
XiXi{x1,,xN}

Однак ми також могли б використовувати більш короткі зразки довжини та розглянути оцінювач Виявляється, як , оцінювач ( ) має такий самий обмежуючий розподіл, що і в більшості налаштувань, де ( ) тримає і десь там, де цього немає. У цьому випадку ( ) та ( ) мають однаковий обмежуючий розподіл, мотивуючи поправочний коефіцієнт наприклад, стандартне відхилення вибірки.M<N

(2)M(TM(X1,,XM)μ^N).
M,N2112MN

Усі ці аргументи є асимптотичними і утримуються лише в межі . Щоб це працювало, важливо не вибирати занадто малим. Існує деяка теорія (наприклад, Бікель і Саков нижче) щодо того, як вибрати оптимальне як функцію щоб отримати найкращі теоретичні результати, але у вашому випадку обчислювальні ресурси можуть бути вирішальним фактором.M,NM MN

Для певної інтуїції: у багатьох випадках у нас є як , так що можна вважати трохи схожим на з завантажувального пристрою з та (я використовую нижній регістр, щоб уникнути плутанини позначень ). Таким чином, емуляція розподілу ( ) за допомогою з завантажувальної програми з є більш "правильною" справою, ніж традиційна ( зμ^NDμN

(3)N(TN(X1,,XN)μ),
mnm=Nn=3MNM<NNN) вид. Додатковим бонусом у вашому випадку є те, що оцінити їх менш обчислювально.

Як ви згадуєте, Політ і Романо - це головний документ. Я знаходжу Bickel та ін (1997) нижче приємного огляду з завантажувальної програми.MN

Джерела :

PJ Bickel, F Goetze, WR van Zwet. 1997. Перекомпонування менше, ніж спостережень: прибутки, збитки та засоби відшкодування збитків. Statistica Sinica.n

PJ Bickel, A Sakov. 2008 р. Про вибір у nf завантажувальних і довірчих меж для екстремуму. Statistica Sinica.mmn


3

Ознайомившись з даною темою, здається, що існує «теорія підвідбірки», що дозволяє проводити оцінку цього типу довірчого інтервалу. Ключовим посиланням є "Politis, DN; Romano, JP (1994). Великі вибіркові довірчі регіони, засновані на субпроборах з мінімальними припущеннями. Анали статистики, 22, 2031-2050".

Ідея полягає у тому, щоб зробити вибірки з розміром M <N, "без заміни" для кожного зразка (але із заміною на різні зразки розміром В), з N початкових точок даних (у моєму випадку серія) та оцінити довірчий інтервал параметр, що цікавить, використовуючи ці зразки та загальний метод завантаження. Потім масштабуйте довірчий інтервал на основі швидкості зміни дисперсії базового розподілу параметра зі змінами в М. Ця швидкість становить 1 / М у багатьох загальних налаштуваннях, але може бути емпірично оцінена, якщо ми повторимо процедуру з кількома різними М Значення та перегляньте зміни величини міжпроцентних діапазонів.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.