Отже, у мене є матриця розміром приблизно 60 х 1000. Я розглядаю її як 60 об'єктів з 1000 особливостями; 60 об’єктів об’єднані в 3 класи (a, b, c). 20 предметів у кожному класі, і ми знаємо справжню класифікацію. Мені хотілося б вивчити під контролем цей набір з 60 прикладів навчання, і мене цікавлять як точність класифікатора (і пов'язані з ним показники), так і вибір функції на 1000 функцій.
По-перше, як моя номенклатура?
Тепер справжнє питання:
Я міг би кинути на нього випадкові ліси, як це зазначено, або будь-яку кількість інших класифікаторів. Але є тонкощі - я дійсно дбаю лише про те, щоб відрізняти клас c від класів a і b. Я міг би об'єднати класи a і b, але чи є хороший спосіб використовувати апріорні знання про те, що всі об'єкти, що не стосуються c, ймовірно, утворюють два різних кластери? Я вважаю за краще використовувати випадкові ліси або їхні варіанти, оскільки це було показано, що він ефективний для даних, подібних до моїх. Але я міг би переконатись, спробувавши деякі інші підходи.