Основним випадком використання для упаковки є зменшення дисперсії моделей з низьким ухилом, з'єднання їх між собою. Це було досліджено емпірично у важливій статті " Емпіричне порівняння алгоритмів класифікації голосування: баггінг, підсилення та варіанти " Бауера та Кохаві . Зазвичай працює як рекламується.
Однак, всупереч поширеній думці, пакетування не гарантується для зменшення дисперсії . Більш свіжим і (на мій погляд) кращим поясненням є те, що мішок зменшує вплив важелів. Точки важеля - це ті, які непропорційно впливають на отриману модель, наприклад, переживаючи регресію найменших квадратів. Вкрай рідко, але можливо, щоб позиційні точки позитивно впливали на отримані моделі, і в такому випадку розфасовка знижує продуктивність. Погляньте на " Баггінг вирівнює вплив " Грандвалета .
Отже, щоб нарешті відповісти на ваше запитання: ефект мішків багато в чому залежить від балів. Існує небагато теоретичних гарантій, за винятком того, що розфасовка лінійно збільшує час обчислення з точки зору розміру мішка! Однак, це все ще широко використовується і дуже потужна техніка. Наприклад, навчаючись із шумом міток, наприклад, мішок може створити більш надійні класифікатори .
Рао і Тібширані дали байєсівську інтерпретацію " Методу поза завантаження для моделювання усереднення та вибору " :
У цьому сенсі розподіл завантажувальної програми представляє (приблизний) непараметричний, неінформативний задній розподіл для нашого параметра. Але такий розподіл завантажувального пристрою отримується безболісно - без необхідності формально вказати попередній та без необхідності вибірки з заднього розподілу. Отже, ми можемо подумати про розподіл завантажувального апарату як про бідного чоловіка "Bayes posterior.