Я вивчаю класифікацію SVM і стикаюся з проблемою. Я не впевнений, чи є в цій дилемі термінологія для цього.
Припустимо, ми хотіли б класифікувати пацієнта за SVM за даними зразків здорових людей (обох статей) та людей з раком печінки (обох статей). Якщо ми позначимо вибірку здорових людей як 1 клас, а людей, хворих на рак, як клас 2, ми можемо навчити бінарний SVM і отримати класифікатор 1 для прогнозування будь-якого нового пацієнта. Тепер зображте інший сценарій. Припустимо, що ми спочатку розділимо всі вибірки за статтю перед класифікацією SVM. Для кожної статі ми досі класифікуємо здорових пацієнтів та хворих на рак у 2 класи та навчаємо бінарний SVM для отримання класифікатора 2 та класифікатора 3 для жіночих та чоловічих зразків відповідно. Питання в тому, чи є нова пацієнтка, який класифікатор, 1 або 2, слід використовувати для отримання більш точного прогнозу? Ось дилема аргументів, які я маю
(1) Коли кількість зразків велика, прогноз повинен бути більш точним. Виходячи з цього аргументу, класифікатор 1 здається хорошим вибором.
(2) Однак, якщо спочатку поділити зразки на жіночі та чоловічі групи, класифікатор 2 здається кращим вибором, оскільки новий пацієнт (невідомий тестовий зразок) є жінкою.
Чи є у цього роду дилема термінологія чи хтось знає додаткову інформацію або як вирішити подібну проблему? Я навіть не впевнений, чи це законне питання, і заздалегідь вибачте за наївне питання. Дякую