Я чув таке вираз раніше:
"Оптимізація - корінь усього зла в статистиці".
Наприклад, головна відповідь у цій темі робить це твердження з посиланням на небезпеку занадто агресивної оптимізації під час вибору моделі.
Перше моє запитання наступне: Чи цитата може бути приписана комусь зокрема? (наприклад, у статистичній літературі)
Як я розумію, у заяві йдеться про ризики перевиконання. Традиційна мудрість сказала б, що правильна перехресна перевірка вже бореться з цією проблемою, але схоже, що до цієї проблеми є більше, ніж до цього.
Чи повинні статисти та практикуючі з МЛ насторожено ставляться до надмірної оптимізації своїх моделей навіть при дотриманні строгих протоколів перехресної перевірки (наприклад, 100 вкладених 10-кратних резюме)? Якщо так, то як ми можемо знати, коли припинити пошук "найкращої" моделі?