Грубо кажучи, деякі випадки надмірного розміщення, які можуть трапитися на одному дереві (це загалом причина обрізки), пом'якшуються двома речами у випадковому лісі:
- Справа в тому, що зразки, які використовуються для тренування окремих дерев, "завантажуються".
- Той факт, що у вас є безліч випадкових дерев, що використовують випадкові ознаки, і, отже, окремі дерева є сильними, але не настільки співвіднесеними між собою.
Редагувати: на основі коментаря ОП нижче:
Однозначно є ще потенціал для надмірного пристосування. Що стосується статей, ви можете прочитати про мотивацію «мішковини» Бреймана та «завантаження» в цілому Ефроном та Тібшірані. Що стосується 2., Бріман вивів слабке обмеження на похибку узагальнення, пов’язану з міцністю дерева та антикореляцією окремих класифікаторів. Ніхто не використовує пов'язане (швидше за все), але це покликане дати інтуїцію про те, що допомагає низьким помилкам узагальнення в методах ансамблю. Про це йдеться у самому документі "Випадкові ліси". Моя публікація повинна була підштовхнути вас у правильному напрямку, грунтуючись на цих показаннях та моєму досвіді / відрахуванні.
- Брейман, Л., Провідники спокусливості, машинне навчання, 24 (2), с.123-140, 1996.
- Ефрон, Б.; Тібшірані, Р. (1993). Вступ до завантажувальної програми. Boca Raton, FL
- Брейман, Лев (2001). «Випадкові ліси». Машинне навчання 45 (1): 5–32.