Я вважаю, що прийнята на даний момент відповідь є неповним нещасним чином. Я не згоден із вироком
Метою перехресної перевірки є визначення параметрів навчання, які добре узагальнюють по всіх зразках сукупності, з яких ми дізнаємось у кожному складі.
Це дійсно одне дуже важливе застосування перехресної перевірки, але не єдине. Зазвичай вам потрібно зробити дві речі:
- Створіть найкращу модель, яку можете
- Складіть точне враження, наскільки добре воно працює
Тепер, щоб виконати ціль 1, залежно від вашого алгоритму, вам може знадобитися налаштування деяких гіперпараметрів, і це дійсно часто робиться шляхом перехресної перевірки. Але це ще не допомагає вам в задачі 2. Для цього вам потрібно в основному вкласти перехресну перевірку, як це:
- Відокремте цілі дані в п ять
- Для кожної сторінки знову складіть окремі дані тренувань у підпапки
- Скористайтеся перехресною валідацією на підпапках, щоб дізнатися хороші гіперпараметри
- За допомогою цих гіперпараметрів побудуйте модель на тренувальних даних цієї складки
- Перевірте модель на даних тесту
- Повторіть наступну складку
Щоб побудувати хорошу модель, вам просто потрібна внутрішня перехресна перевірка. Вам все одно доведеться це зробити, щоб отримати гарну модель. Але для отримання хорошої оцінки продуктивності вашої моделі потрібно виконати весь процес побудови моделі всередині схеми перехресної перевірки. Сюди також входять етапи, такі як імпутація тощо.