Припустимо, я тренував кілька моделей на навчальному наборі, вибирав найкращу, використовуючи набір перехресних перевірок і вимірював продуктивність на тестовому наборі. Тож тепер у мене є одна остаточна найкраща модель. Чи повинен я перекваліфікувати його на всіх своїх наявних даних або на суднових рішеннях, що навчаються лише на навчальному наборі? Якщо останні, то чому?
ОНОВЛЕННЯ: Як зазначав @ P.Windridge, доставка перекваліфікованої моделі в основному означає доставку моделі без валідації. Але ми можемо повідомити про ефективність тестових наборів і після цього перевчити модель за повними даними, справедливо очікуючи, що ефективність буде кращою - адже ми використовуємо нашу найкращу модель плюс більше даних. Які проблеми можуть виникнути внаслідок такої методології?