Плюси і мінуси завантаження


11

Щойно я дізнався про концепцію завантажувального завантаження, і надумалося наївне запитання: якщо ми завжди можемо генерувати численні зразки завантажувальних даних з наших даних, навіщо взагалі турбуватися отримувати більше "реальних" даних?

Я думаю, що у мене є пояснення, будь ласка, скажіть мені, чи я прав: я думаю, що процес завантаження зменшує дисперсію, АЛЕ якщо мій оригінальний набір даних BIASED, ніж я застряг із низькою дисперсією та великим ухилом, незалежно від того, скільки реплік Я беру.


4
завантажувальне завантаження не створює більше інформації, ніж це вже є в даних (і моделі) ... фактичні дані можуть дати вам більше інформації
Glen_b -Встановити Моніку

2
Я погоджуюся з Glen_b, що вона не створює більше інформації, але я не згоден, що вона може дати вам менше інформації. Як я вже говорив у своїй відповіді, це не завжди працює добре, але це можна сказати про будь-який статистичний метод.
Майкл Р. Черник

1
Цікаве запитання - можливо, пов’язане з цим поняття, чому працює завантажувальна машина? . Розуміння цього допоможе зрозуміти, коли це корисно. Я вважав завантажувальну систему як покращення порівняно з нормальним наближенням для розподілу вибірки. Він може вирішити відхилення від нормальності, які не надто екстремальні. Ще одна приваблива особливість - вам не потрібно робити аналітичну / алгебраїчну роботу - реплікація робить це за вас.
ймовірністьлогічний

Відповіді:


15

Завантажувальний пристрій - це метод робити висновок таким чином, що не потрібно приймати параметричну форму для розподілу населення. Він не розглядає оригінальний зразок так, як якщо б це популяція, навіть ті, що стосуються відбору проб із заміною вихідного зразка. Він передбачає, що відбір проб із заміною вихідного зразка розміром n імітує взяття зразка розміром n з більшої сукупності. Він також має багато варіантів, таких як m з n завантажувальної стрічки, який повторно відбирає m час із вибірки розміром n, де m <n. Приємні властивості завантажувальної стрічки залежать від асимптотичної теорії. Як згадували інші, завантажувальний пристрій не містить більше інформації про населення, ніж те, що наведено в оригінальній вибірці. З цієї причини, іноді це не добре працює у невеликих пробах.

У другій моїй книзі "Методи завантаження: Посібник для практиків", опублікованій Wiley в 2007 році, я вказую на ситуації, коли завантажувальний пристрій може вийти з ладу. Сюди входить розподіл, у якого немає кінцевих моментів, невеликі розміри вибірки, оцінка екстремальних значень від розподілу та оцінка відхилення у вибірковому обстеженні, де розмір сукупності становить N та береться великий зразок n. У деяких випадках варіанти завантажувальної програми можуть працювати краще, ніж оригінальний підхід. Це трапляється з m out of n bootstrap у деяких програмах. У разі оцінки частоти помилок при дискримінаційному аналізі завантажувальна програма 632 є вдосконаленням порівняно з іншими методами, включаючи інші методи завантаження.

Причиною його використання є те, що іноді ви не можете покластися на параметричні припущення, а в деяких ситуаціях завантажувальна програма працює краще, ніж інші непараметричні методи. Він може бути застосований до найрізноманітніших проблем, включаючи нелінійну регресію, класифікацію, оцінку довірчого інтервалу, оцінку зміщення, коригування p-значень та аналіз часових рядів.


6

Зразок завантажувальної програми може розповісти лише про вихідний зразок, і не дасть вам нової інформації про реальну сукупність. Це просто непараметричний метод побудови довірчих інтервалів тощо.

Якщо ви хочете отримати більше інформації про населення, вам доведеться зібрати більше даних від населення.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.