Скажіть, що у мене є два методи навчання проблеми класифікації , і , і я оцінюю їх узагальнюючу ефективність чимось на зразок повторної перехресної перевірки або завантаження. З цього процесу я отримую розподіл балів та для кожного методу через ці повтори (наприклад, розподіл значень AUC ROC для кожної моделі).Б П А П Б
Дивлячись на ці розподіли, може бути, що але (тобто очікувана ефективність узагальнення вище, ніж , але щодо цієї оцінки існує більше невизначеності).σ A ≥ σ B A B
Я думаю, що це називається дилемою зміщення-дисперсії у регресії.
Які математичні методи я можу використати для порівняння та та врешті-решт прийняти обгрунтоване рішення, яку модель використовувати?П Б
Примітка. Для простоти я маю на увазі два методи і тут, але мене цікавлять методи, які можна використовувати для порівняння розподілу балів ~ 1000 методів навчання (наприклад, за допомогою пошуку в сітці) і в кінцевому підсумку зробити остаточне рішення про те, яку модель використовувати.Б