У CrossValided є численні теми на тему вибору моделі та перехресної перевірки. Ось декілька:
- Внутрішня та зовнішня перехресна перевірка та вибір моделі
- @ Найвища відповідь DikranMarsupial на вибір функції та перехресну перевірку
Однак відповіді на ці теми є досить загальними і здебільшого висвітлюють питання з особливими підходами до перехресної валідації та вибору моделі.
Щоб зробити речі максимально конкретними , скажімо, наприклад, що ми працюємо з SVM з ядром RBF: , і що у мене є набір даних функційXі мітокy, і що я хочу
- Знайдіть найкращі можливі значення моєї моделі ( і C )
- Навчити SVM за допомогою мого набору даних (для остаточного розгортання)
- Оцініть помилку узагальнення та невизначеність (дисперсію) навколо цієї помилки
Для цього я б особисто здійснив пошук в сітці, наприклад, я намагаюся використовувати всі можливі комбінації і γ . Для простоти можна припустити наступні діапазони:
Більш конкретно, використовуючи повний набір даних, я роблю наступне:
- Для кожної пари ( , γ ) я виконую повторні ітерації (наприклад, 100 випадкових повторів) K- кратної перехресної перевірки (наприклад, K = 10 ) на своєму наборі даних, тобто я треную свій SVM на K - 1 складках і оцінюю помилку на складці ліворуч, перебираючи всі K складки. Загалом я збираю 100 х 10 = 1000 тестових помилок.
- Для кожної такої ( , γ ) пари, я обчислити середнє значення і дисперсію цих тестових 1000 ПОМИЛОК М М , сг М .
Тепер я хочу вибрати найкращу модель (найкращі параметри ядра), яку я використовував би для тренування мого остаточного SVM для повного набору даних. Я розумію, що при виборі моделі , яка мала саму низьку середню помилку і дисперсію і σ M буде правильний вибір, і що моделі μ M є σ M мої найкращі оцінки зміщення помилки узагальнення моделі і дисперсії , коли навчання з повний набір даних.
АЛЕ, прочитавши відповіді у вищезазначених потоках, у мене складається враження, що цей метод вибору найкращого SVM для розгортання та / або для оцінки його помилки (ефективність узагальнення) є недоліком, і що є кращі способи вибору найкращий SVM та повідомляє про свою помилку. Якщо так, то що вони? Шукаю конкретну відповідь, будь ласка.
Дотримуючись цієї проблеми, як конкретно я можу вибрати найкращу модель та правильно оцінити її помилку узагальнення ?