Є два джерела дисперсії OOB. Один - випадковість самої процедури; це можна зменшити за рахунок збільшення кількості дерев.
Іншим джерелом дисперсії є непридатна недосконалість обмеженості даних та життя у складному світі. Збільшення кількості дерев цього не вдається виправити.
Крім того, іноді просто не вистачає даних для вирішення проблеми. Наприклад, уявіть, що два екземпляри мають протилежні мітки, але однакові значення функції. Один з цих зразків завжди буде класифікованим. (Це надзвичайний приклад, але ілюструє, як деякі проблеми не піддається вирішенню. Ми можемо їх дещо розслабити, розглянувши крихітне збурення до одного вектора; тепер його зазвичай класифікують так само, як його двійника, але не завжди.) Щоб вирішити цю проблему , вам доведеться зібрати додаткові вимірювання для подальшого розмежування двох точок.
р ( у= 1 | х )х¯х¯х¯∼ N( μ , σ2н)мкσ2х¯σ2= 0
Невідмінна дисперсія не може бути виправлена завантажувальним завантаженням. Більше того, випадкові ліси вже завантажені; це частина причини, що вона має "випадковий" у своїй назві. (Інша причина полягає в тому, що при кожному розбитті вибирається випадковий набір функцій.)