Змагання з Kaggle визначають остаточний рейтинг на основі проведеного тестового набору.
Проведений тестовий набір - зразок; він може не репрезентувати населення, яке моделюється. Оскільки кожне подання схоже на гіпотезу, алгоритм, який виграв змагання, може, як правило, збігатися з тестовим набором краще, ніж інші. Іншими словами, якби обраний інший тестовий набір і змагання повторилися, чи залишиться рейтинг тим самим?
Для корпорації, яка спонсорує це, насправді це не має значення (можливо, найкращі 20 заявок покращать їх базовий рівень). Хоча, за іронією долі, вони, можливо, можуть використати першокласну модель, яка гірша, ніж інші п’ятірки. Але, для учасників змагань, здається, що Kaggle в кінцевому рахунку - це азартна гра - удачі не потрібно натрапляти на правильне рішення, потрібно натрапити на те, що відповідає тестовому набору!
Чи можна змінити змагання так, щоб виграли всі найкращі команди, які не можуть бути статистично розрізнені? Або в цій групі могла виграти сама парсимонічна чи обчислювально дешева модель?