Дано
- набір даних з екземплярами разом з класами, де кожен екземпляр належить саме одному класу N x i y i
- багатокласовий класифікатор
Після навчання та тестування я в основному маю таблицю з справжнім класом та передбачуваним класом для кожного екземпляра в тестовому наборі. Отже, для кожного екземпляра я маю відповідність ( ) або промах ( ).
Як я можу оцінити якість матчу? Проблема полягає в тому, що деякі класи можуть мати багато членів, тобто багато примірників належать до нього. Очевидно, якщо 50% усіх точок даних належать до одного класу, а мій остаточний класифікатор загалом на 50% правильний, я нічого не отримав. Я міг би так само добре зробити тривіальний класифікатор, який виводить цей найбільший клас незалежно від того, який вхід є.
Чи існує стандартний метод оцінювання якості класифікатора на основі відомих результатів тестового набору збігів та звернень для кожного класу? Можливо, навіть важливо розрізняти коефіцієнти відповідності для кожного конкретного класу?
Найпростіший підхід, який я можу придумати, - це виключити правильні відповідники найбільшого класу. Що ще?