У мене є дані з кількома тисячами функцій, і я хочу зробити рекурсивний вибір функцій (RFE), щоб видалити неінформативні. Я роблю це з каретою та RFE. Однак я почав думати, якщо я хочу отримати найкращу регресію (наприклад, випадковий ліс), коли мені слід виконати налаштування параметрів ( mtry
для РФ)? Тобто, наскільки я розумію, карет тренується РФ неодноразово на різних підмножинах з фіксованою мтри. Я припускаю, що оптимум mtry
слід знайти після завершення вибору функції, але чи вплине mtry
значення, яке використовує карет, на вибраний підмножина функцій? Звичайно, використання карети з низьким mtry
набагато швидше.
Сподіваюся, хтось може мені це пояснити.