Я не можу говорити зі швидкістю конкретних алгоритмів в R, але повинно бути очевидним, що викликає тривалий час обчислень. Для кожного дерева на кожній гілці CART шукає форму найкращого двійкового розколу. Отже, для кожної з 34 особливостей вона найбільше дивиться на розбиття, задані кожним із рівнів змінних. Помножте час виконання кожного розщеплення на дереві на кількість гілок на дереві, а потім помножте на кількість дерев у лісі, і у вас тривалий час. Хто знає? Може, навіть за допомогою швидкого комп’ютера це може зайняти роки?
Найкращий спосіб прискорити роботу, я думаю, було б зібрати деякі рівні разом, щоб кожна змінна знизилася до, можливо, від 3 до 5 рівнів замість цілих 300. Звичайно, це залежить від можливості зробити це, не втрачаючи важливого інформація у ваших даних.
Після цього, можливо, ви можете подивитися, чи є якийсь розумний алгоритм, який може прискорити час пошуку для розщеплення на кожному вузлі окремих дерев. можливо, що для конкретного дерева розділений пошук - це повтор пошуку, вже зроблений для попереднього дерева. Тож якщо ви можете зберегти рішення попередніх розділених рішень та визначити, коли ви повторюєте, можливо, ця стратегія могла трохи заощадити на обчисленні часу.