Відповіді:
Правильно класифікована пропорція - це неправильне правило балів, тобто воно оптимізоване помилковою моделлю. Я використовував би правильне квадратичне правило, відоме як оцінка Brier, або ймовірність узгодження (область під кривою ROC у двійковому випадку ). Випадковий ліс працює краще, ніж SVM у вашому випадку.
Я думаю, що ви, безумовно, повинні вивчити більше показників, ніж просто AUC та точність.
Точність (разом з чутливістю та специфічністю) - це дуже проста, але упереджена метрика, яка змушує вас дивитися на абсолютний результат передбачення і не відкриває для затвердження ймовірностей класів чи ранжування. Він також не враховує сукупність, яка закликає до неправильного трактування як моделі, що дає 95% точність для населення з 95% шансом виправити випадковість, насправді не є хорошою моделлю, навіть якщо точність висока.
AUC - це хороший показник для встановлення точності моделі, незалежної від ймовірностей класу населення. Однак це не скаже вам нічого про те, наскільки хороші оцінки ймовірності насправді. Ви можете отримати високий AUC, але все ще маєте дуже перекошені оцінки ймовірностей. Цей показник більш дискримінаційний, ніж точність, і, безумовно, дасть вам кращі моделі при використанні в поєднанні з яким-небудь правильним правилом балів, наприклад, оцінка Brier, як згадується в іншому дописі.
Тут ви можете отримати більш офіційний доказ, хоча цей документ є цілком теоретичним: AUC: статистично несуперечливий і більш дискримінаційний захід, ніж точність
Однак є маса хороших показників. Функції втрат для оцінки й класифікації ймовірностей бінарного класу: Структура та додатки - це хороший документ, що досліджує правильні правила балів, такі як оцінка Brier.
Інший цікавий документ із показниками для підтвердження продуктивності моделі - Оцінка: від точності, відкликання та вимірювання F до ROC, інформованості, помітності та кореляції з використанням інших показників хорошої ефективності, таких як інформованість.
Підводячи підсумок, я рекомендую переглянути показник AUC / Gini та Brier, щоб визначити ефективність вашої моделі, але залежно від цілі вашої моделі інші показники можуть краще відповідати вашій проблемі.