Я розумію, що випадковий ліс вибирає випадковим чином mtry змінних для побудови кожного дерева рішень. Отже, якщо mtry = ncol / 3, то кожна змінна буде використовуватися в середньому на 1/3 дерев. І 2/3 дерев ними не користуватимуться.
Але що робити, якщо я знаю, що одна змінна, ймовірно, дуже важлива, було б добре вручну збільшити ймовірність того, що ця змінна буде обрана в кожному дереві? Чи це можливо з пакетом randomForest в R?