Я усвідомлюю, що в моделі прискорення дерев є 3 параметри настройки, тобто
- кількість дерев (кількість ітерацій)
- параметр усадки
- кількість розщеплень (розмір кожного складового дерева)
Моє запитання: як для кожного з параметрів настройки я повинен знайти його оптимальне значення? А який метод?
Зауважте: параметр усадки та кількість параметрів дерев працюють разом, тобто менше значення параметра усадки призводить до більш високого значення кількості дерев. І нам це потрібно враховувати.
Мене особливо цікавить метод пошуку оптимального значення для кількості розщеплень. Чи повинна вона базуватися на перехресній валідації або знаннях домену про модель, що стоїть?
І як ці речі виконуються в gbm
пакеті на R?