Хоча результати приватного тестового набору не можуть бути використані для подальшого вдосконалення моделі, чи не є вибір моделі з величезної кількості моделей на основі результатів приватного тестового набору? Чи не вдалося б ви, лише через цей процес, прилаштуватись до приватного тестового набору?
Відповідно до "Псевдоматематики та фінансового шарлатанізму: Вплив перенапруження на випробування поза результатами вибірки" Бейлі та ін. порівняно легко «переоцінити» при виборі найкращого з великої кількості моделей, оцінених за одним і тим же набором даних. Це не відбувається з приватним лідером Kaggle?
- Які статистичні обгрунтування для найбільш ефективно діючих моделей приватного лідеру є моделями, що узагальнюють найкращі для вибіркових даних?
- Чи справді компанії користуються виграшними моделями, або приватний лідери там просто пропонують "правила гри", а компанії насправді більше зацікавлені в розумінні, яке виникає в результаті обговорення проблеми?