Нещодавно я натрапив на документ, який пропонує використовувати класифікатор k-NN на певному наборі даних. Автори використовували всі наявні вибірки даних для здійснення k-кратної перехресної перевірки для різних значень k та звітування про результати перехресної перевірки найкращої конфігурації гіперпараметра.
Наскільки мені відомо, цей результат є необ'єктивним, і вони повинні були зберегти окремий тестовий набір для отримання оцінки точності на зразках, які не використовуються для оптимізації гіперпараметрів.
Чи правий я? Чи можете ви надати кілька посилань (бажано наукових робіт), які описують це неправильне використання перехресної перевірки?