Типовим підходом до вирішення проблеми класифікації є визначення класу кандидатних моделей, а потім проведення вибору моделі за допомогою певної процедури, наприклад перехресної перевірки. Зазвичай вибирають модель з найбільшою точністю або якусь пов'язану функцію, що кодує конкретну інформацію про проблему, наприклад .
Припустимо, що кінцевою метою є створення точного класифікатора (де визначення точності знову залежить від проблеми), в яких ситуаціях краще виконати вибір моделі, використовуючи правильне правило балів , на відміну від чогось неналежного, як точність, точність, нагадування тощо? Крім того, давайте ігноруємо питання складності моделі та припустимо, що апріорі ми вважаємо всі моделі однаково вірогідними.
Раніше я б сказав ніколи. Ми знаємо, що у формальному розумінні класифікація є легшою проблемою, ніж регресія [1], [2], і ми можемо отримати більш жорсткі межі для перших, ніж пізніші ( ). Крім того, існують випадки, коли спроба точно співставити ймовірності може призвести до неправильних меж рішення або перевищення рівня . Однак, виходячи з розмови тут та схеми голосування громади щодо таких питань, я ставив під сумнів цю думку.
- Девроє, Люк. Імовірнісна теорія розпізнавання образів. Вип. 31. Springer, 1996., розділ 6.7
- Кірнс, Майкл Дж. Та Роберт Е. Шапір. Ефективне безрозподільне вивчення імовірнісних концепцій. Основи інформатики, 1990. Матеріали., 31-й щорічний симпозіум о. IEEE, 1990.
Це твердження може бути трохи неохайним. Я конкретно маю на увазі, що задані мічені дані форми з та , здається, простіше оцінити межу рішення, ніж точно оцінити умовні ймовірності.