Моє головне питання - це намагання зрозуміти, як перехресна перевірка k-кратна вписується в контекст набору навчальних / валідаційних / тестувальних наборів (якщо вона взагалі відповідає такому контексту).
Зазвичай люди говорять про розбиття даних на навчальний, валідаційний та тестовий набір - скажімо, у співвідношенні 60/20/20 за курс Ендрю Нґ - при цьому набір перевірки використовується для визначення оптимальних параметрів для модельного навчання.
Однак, якщо хтось хотів використати перехресну перевірку k-кратної надії, сподіваючись отримати більш репрезентативний показник точності, коли кількість даних порівняно невелика, що робити перехресну перевірку k-кратну тягне за собою саме цей розкол 60/20/20 сценарій?
Наприклад, чи означає це, що ми насправді поєднуємо навчальні та тестові набори (80% даних) і робимо k-кратну перехресну перевірку на них, щоб отримати міру точності (фактично відмовляючись від наявності явного «тестового набору»? Якщо так, то яку навчану модель ми використовуємо: а) у виробництві; б) використовувати проти набору валідацій та визначати оптимальні параметри навчання? Наприклад, однією з можливих відповідей для a і b є, можливо, використання найкращої моделі.