Методи ансамблю на основі дерев, такі як "Випадковий ліс" та наступні похідні (наприклад, умовний ліс), усі вони вважають корисними у так званих "малих n , великих p " проблемах для визначення відносної змінної важливості. Дійсно, це так і є, але моє питання полягає в тому, наскільки далеко можна взяти цю здатність? Чи можна мати, скажімо, 30 спостережень і 100 змінних? Що є переломним для такого підходу, і чи існують якісь пристойні правила? Я вважаю за краще і прийму відповіді, підкріплені посиланнями на фактичні докази (а не на думку), використовуючи або симульовані, або реальні набори даних. Я не знайшов багато про останні ( тут і тут)), тож ваші думки / поради / (по темі) довідкові пропозиції найкраще вітаються!