Не існує єдиної відповіді про те, який найкращий метод класифікації для даного набору даних . Для порівняльного дослідження для даного набору даних завжди слід враховувати різні види класифікаторів. З огляду на властивості набору даних, у вас можуть бути деякі підказки, які можуть віддати перевагу деяким методам. Однак все-таки було б доцільно експериментувати з усіма, якщо це можливо.
Naive Bayes Classifier (NBC) та підтримка векторної машини (SVM) мають різні варіанти, включаючи вибір функції ядра для кожного. Вони чутливі до оптимізації параметрів (тобто різний вибір параметрів може істотно змінити їх вихід) . Отже, якщо у вас є результат, який показує, що NBC працює краще, ніж SVM. Це справедливо лише для вибраних параметрів. Однак для іншого вибору параметрів ви можете виявити, що SVM працює краще.
Взагалі, якщо припущення про незалежність у NBC задовольняється змінними вашого набору даних, а ступінь перекриття класу невеликий (тобто потенційна межа лінійного рішення), очікується, що NBC добрий. Для деяких наборів даних, наприклад, оптимізація за допомогою вибору функції обгортки, наприклад, NBC може перемогти інші класифікатори. Навіть якщо він досягне порівняльних показників, NBC буде більш бажаним через високу швидкість.
Підсумовуючи це, ми не повинні віддавати перевагу жодному методу класифікації, якщо він перевершує інших в одному контексті, оскільки він може сильно вийти з ладу в іншому. ( ЦЕ НОРМАЛЬНО У ПРОБЛЕМАХ ЗВІДНОСТІ ДАНИХ ).