Роль параметра n.minobsinnode GBM в R [закрито]


21

Мені хотілося знати, що означає параметр n.minobsinnode у пакеті GBM. Я читав посібник, але не ясно, що це робить. Чи повинно це число бути малим чи великим, щоб покращити результати?


9
"Це питання навряд чи допоможе майбутнім відвідувачам". Я майбутній відвідувач, і я вважав це корисним.
Flounderer

1
Я також вважав це корисним.
oaxacamatt

Відповіді:


25

На кожному кроці алгоритму GBM будується нове дерево рішень. Питання при вирощуванні дерева рішень - «коли зупинитись?». Найбільш віддаленим є поділ кожного вузла, поки не буде лише 1 спостереження у кожному кінцевому вузлі. Це відповідатиме n.minobsinnode = 1. Альтернативно, розщеплення вузлів може припинитися, коли в кожному вузлі знаходиться певна кількість спостережень. За замовчуванням для пакету R GBM - 10.

Яке найкраще значення використовувати? Це залежить від набору даних і того, чи здійснюєте ви класифікацію чи регресію. Оскільки передбачення кожного дерева сприймається як середнє значення залежної змінної всіх входів у кінцевому вузлі, значення 1, ймовірно, не спрацює так добре для регресії (!), Але може бути придатним для класифікації.

Більш високі значення означають менші дерева, тому алгоритм запускає швидше і використовує менше пам'яті, що може враховувати.

Як правило, результати не дуже чутливі до цього параметра, а враховуючи стохастичний характер продуктивності ГБМ, фактично може бути важко визначити, яке значення є "найкращим". Загалом глибина взаємодії, кількість усадки та кількість дерев будуть набагато значнішими.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.