Я навчив дві моделі (двійкові класифікатори, використовуючи h2o AutoML), і хочу вибрати одну для використання. У мене є такі результати:
model_id auc logloss logloss_train logloss_valid gini_train gini_valid
DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975
DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662
і auc
і logloss
стовпці - це показники крос-валідації (для перехресної перевірки використовуються лише навчальні дані). значення ..._train
та ..._valid
метрики знаходять, запустивши метрики навчання та перевірки відповідно до моделей. Я хочу або використовувати, logloss_valid
або gini_valid
вибрати кращу модель.
Модель 1 має кращий джині (тобто кращий AUC), але модель 2 має кращий журнал. Моє питання - який вибрати, який, на мою думку, ставить питання, які переваги / недоліки використовувати або джині (AUC), або logloss як метрику рішення.