Я думаю, що вам все-таки щось не вистачає в розумінні мети перехресної перевірки.
Давайте розберемося з деякою термінологією, як правило, коли ми говоримо «модель», ми посилаємося на певний метод опису того, як деякі вхідні дані стосуються того, що ми намагаємось передбачити. Ми, як правило, не називаємо окремі випадки цього методу як різні моделі. Отже, ви можете сказати: «У мене лінійна регресійна модель», але ви б не називали два різні набори підготовлених коефіцієнтів різними моделями. Принаймні, не в контексті вибору моделі.
Отже, коли ви робите перехресну перевірку K-кратного вибору, ви тестуєте, наскільки ваша модель здатна навчитися деяким даним, а потім передбачити дані, які вона не бачила. Для цього ми використовуємо перехресну перевірку, оскільки якщо ви тренуєтесь, використовуючи всі наявні дані, у вас не залишилося нічого для тестування. Ви можете зробити це один раз, скажімо, використовуючи 80% даних для тренувань і 20% для тестування, але що робити, якщо 20%, яких ви вибрали для тестування, містять купу очок, які є дуже простими (або особливо важкими) передбачити? Ми не придумаємо найкращої можливої оцінки можливостей моделей вивчати та прогнозувати.
Ми хочемо використовувати всі дані. Отже, щоб продовжити вищенаведений приклад розділення 80/20, ми зробили б 5-кратну перехресну перевірку, навчаючи модель 5 разів на 80% даних та тестуючи на 20%. Ми гарантуємо, що кожна точка даних закінчується в тестовому наборі 20% рівно один раз. Тому ми використовували кожну точку даних, яку ми маємо зробити для того, щоб зрозуміти, наскільки добре наша модель виконує завдання з вивчення деяких даних та передбачення нових даних.
Але мета перехресної перевірки - не придумати нашу остаточну модель. Ми не використовуємо ці 5 екземплярів нашої підготовленої моделі, щоб робити будь-які реальні прогнози. Для цього ми хочемо використати всі дані, які ми маємо, щоб створити найкращу можливу модель. Метою перехресної перевірки є перевірка моделі, а не побудова моделі.
Скажімо, у нас є дві моделі, скажімо, лінійна регресійна модель та нейронна мережа. Як ми можемо сказати, яка модель краща? Ми можемо зробити K-кратну перехресну валідацію і побачити, яка з них виявляється кращою при прогнозуванні встановлених балів тесту. Але після того, як ми використали перехресну валідацію для вибору моделі з найвищою ефективністю, ми будемо тренувати цю модель (будь то лінійна регресія чи нейронна мережа) для всіх даних. Ми не використовуємо фактичні екземпляри моделі, які ми навчали під час перехресної перевірки для нашої остаточної моделі прогнозування.
Зауважимо, що існує техніка, яка називається агрегуванням завантажувального завантаження (зазвичай скорочується до 'мішок'), яка в певному випадку використовує екземпляри моделей, створені таким чином, як перехресні перевірки, для створення моделі ансамблю, але це вдосконалена техніка поза рамками вашого питання тут.