Чи є R випадкова реалізація лісу, яка добре працює з дуже рідкими даними? У мене є тисячі або мільйони булевих вхідних змінних, але лише сотні або близько того будуть ПРАВИЛЬНИми для будь-якого прикладу.
Я відносно новий в R і помітив, що існує пакет "Матриця" для роботи з розрідженими даними, але стандартний пакет "randomForest", схоже, не розпізнає цей тип даних. Якщо це має значення, вхідні дані збираються за межами R та імпортуються.
Будь-яка порада? Я також можу вивчити використання Weka, Mahout або інших пакетів.