Я переосмислював відповідь, яку я дав на питання пару тижнів тому
Перехресне підтвердження витримки виробляє єдиний тестовий набір, який можна повторно використовувати для демонстрації. Ми всі, мабуть, погоджуємось, що це багато в чому негативна особливість, оскільки один витриманий набір може виявитися нерепрезентативним через випадковість. Більше того, ви можете закінчити перевищення тестових даних таким же чином, як і дані про навчання.
Однак мені здається, що статична природа витриманого зразка - це краще наближення до «отримання більшої кількості даних», ніж резюме в k-кратному стані, і уникає питання усереднення по складках. Однак я не можу створити будь-яку статистичну основу для цього почуття. Чи є якась логіка в моїй інтуїції?
Наприклад, те, що я маю на увазі для майбутнього проекту, - це спочатку використовувати перевірку на витримку для складання та тестування моделі, потім як крок перевірки повторно намалював набір декількох разів, щоб показати, що мої оцінки помилки прогнозування ( на тестовому наборі) надійні до помилки вибірки в тестовому наборі. Це погана ідея з якоїсь причини? Це питання було задано раніше, але жодної відповіді не було.