З підручника XGBoost, я думаю, що коли кожне дерево росте, всі змінні скануються, щоб їх було вибрано для розбиття вузлів, і буде вибрано той, який має максимальний розріз посилення. Отже, моє запитання полягає в тому, що якщо я додаю деякі змінні шуму в набір даних, чи вплинуть ці змінні шуми на вибір змінних (для кожного зростаючого дерева)? Моя логіка полягає в тому, що оскільки ці шумові змінні НЕ дають максимального коефіцієнта коефіцієнта посилення, вони ніколи не будуть обрані, тому вони не впливають на ріст дерева.
Якщо відповідь "так", то чи правда, що "чим більше змінних, тим краще для XGBoost"? Не будемо враховувати час тренувань.
Крім того, якщо відповідь "так", то це правда, що "нам не потрібно фільтрувати неважливі змінні з моделі".
Дякую!