Що означає "розмір вузла" у випадковому лісі?


Відповіді:


24

Дерево рішень працює за допомогою рекурсивного розбиття навчального набору. Кожен вузол дерева рішень асоціюється з набором n t точок даних з навчального набору:тнт

n_t - розмір кожного вузла

Ви можете знайти параметр nodesizeу деяких пакетах випадкових лісів, наприклад, R : Це мінімальний розмір вузла , у прикладі вище мінімальний розмір вузла - 10. Цей параметр неявно задає глибину ваших дерев.

nodesize від R випадкового лісового пакету

Мінімальний розмір кінцевих вузлів. Якщо збільшити цю кількість більше, це вирощує менші дерева (і, таким чином, займає менше часу). Зауважте, що значення за замовчуванням відрізняються для класифікації (1) та регресії (5).

В інших пакетах ви безпосередньо знаходите параметр depth, наприклад WEKA :

-depth від випадкового лісового пакету WEKA

Максимальна глибина дерев, 0 необмежена. (за замовчуванням 0)


1
Що таке "записи"? Ви маєте на увазі точки даних? Чому кожен вузол пов'язаний з набором записів? Я досить добре розумію випадкові ліси, але не знаю, що означає жаргон.
wolfsatthedoor

Так, я мав на увазі точку даних. Зазвичай ви можете посилатися на точки даних як записи, екземпляри або приклади.
Симона

Так чи існує правило мінімального розміру вузла великого пальця, щоб уникнути перенапруження дерев? Я думаю, це залежить від розміру навчальних даних, можливо, певна частка розміру набору даних?
Seanosapien

1
У випадкових лісах дерева повністю вирощуються: розмір вузла - 1. Уникнення вирощування багатьох дерев не дозволяє. У дереві рішень це складніше. Дерева вирощуються не повністю, і вам доведеться проводити обрізку, щоб уникнути перезволоження.
Сімоне

1
Схоже, виграш - це якийсь вибір функцій для спрощення дерева та уникнення перенасичення. Гадаю, обрізка одного дерева завжди корисна. Натомість вигравання може іноді знижувати точність, але це спрощує дерево.
Сімоне

2

Незрозуміло, чи розмір вузла знаходиться на вибірці "in-bag" або на помилці "out-of-bag". Якщо він є на вибірці "з-під сумки", він є дещо обмежуючим.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.