На моє розуміння, сильно корельовані змінні не спричинять проблем мультиколінеарності у випадковій лісовій моделі (Будь ласка, виправте мене, якщо я помиляюся). Однак, з іншого боку, якщо у мене буде занадто багато змінних, що містять подібну інформацію, чи буде вага цієї моделі занадто великою, ніж інші?
Наприклад, є два набори інформації (A, B) з однаковою силою прогнозування. Змінна , , ... всі містять інформацію A, і тільки Y містить інформацію B. Коли випадкові вибіркові величини будуть рости більшістю дерев на інформації A, і в результаті інформація B не повністю зафіксована?
multicollinearity
, що НЕ впливає на випадкову лісову модель. Наприклад, тут найбільш відповідна відповідь говорить про те, що "жодна частина випадкової лісової моделі не шкодить висококолінеарним змінним". Чи має це чинність?