Це не гарантується. Як ви кажете, ансамбль міг бути гіршим, ніж окремі моделі. Наприклад, якщо взяти середнє значення справжньої моделі і поганої моделі, це дало б досить погану модель.
Середнє значення моделей покращиться лише тоді, коли моделі (дещо) залежать одна від одної. Наприклад, під час упаковки кожна модель будується з випадкового підмножини даних, тому деяка незалежність вбудована. Або моделі можуть бути побудовані за допомогою різних комбінацій функцій, а потім об'єднані шляхом усереднення.к
Також усереднення моделей добре працює лише тоді, коли окремі моделі мають велику дисперсію. Ось чому побудований випадковий ліс із використанням дуже великих дерев. З іншого боку, усереднення купу лінійних регресійних моделей все ще дає лінійну модель, яка, швидше за все, не буде кращою, ніж моделі, з яких ви почали (спробуйте!)
Інші методи ансамблю, такі як прискорення та змішування, працюють, приймаючи результати з окремих моделей разом із навчальними даними як вхід до більшої моделі. У цьому випадку не дивно, що вони часто працюють краще, ніж окремі моделі, оскільки вони насправді складніші, і вони все ще використовують дані тренувань.