Крім очевидних характеристик класифікатора, як
- обчислювальна вартість,
- очікувані типи даних функцій / міток та
- придатність для певних розмірів і розмірів наборів даних,
які перші п’ять (або 10, 20?) класифікаторів спробувати спершу на новому наборі даних, про який ще не відомо багато (наприклад, семантика та співвідношення окремих ознак)? Зазвичай я пробую Naive Bayes, Найближчий сусід, Дерево рішень та SVM - хоча у мене немає вагомих причин для цього вибору, окрім як я їх знаю, і в основному розумію, як вони працюють.
Я думаю, слід вибрати класифікатори, які охоплюють найважливіші загальні підходи до класифікації. Який вибір ви б рекомендували, згідно з цим критерієм чи з будь-якої іншої причини?
ОНОВЛЕННЯ: Альтернативним формулюванням цього питання може бути: "Які загальні підходи до класифікації існують та які конкретні методи охоплюють найбільш важливі / популярні / перспективні?"