Перехресна перевірка K-кратна (CV) випадковим чином розбиває ваші дані на K-розділи, а ви, у свою чергу, тримаєте одну з цих частин K як тестовий випадок, а інші частини K-1 збираєте разом як ваші навчальні дані. Leave One Out (LOO) - це особливий випадок, коли ви берете свої N даних і робите N-кратне резюме. У певному сенсі Hold Out - це ще один особливий випадок, коли ви вибираєте лише один із своїх складок K як тестовий і не обертаєтеся через всі K складки.
Наскільки я знаю, 10-кратне резюме - це майже річ, оскільки вона ефективно використовує ваші дані, а також допомагає уникнути невдалого вибору розділу. Hold Out не ефективно використовує ваші дані, і LOO не настільки надійний (чи щось подібне), але 10-іш-кратний - це просто правильно.
Якщо ви знаєте, що ваші дані містять більше однієї категорії, а одна чи більше категорій значно менші, ніж решта, деякі ваші випадкові розділи K можуть взагалі не містити жодної з малих категорій, що було б погано. Щоб переконатися, що кожен розділ є досить репрезентативним, ви використовуєте стратифікацію: розбивайте свої дані на категорії, а потім створюйте випадкові розділи, вибираючи випадкову і пропорційну для кожної категорії.
Усі ці варіації резюме в K-кратному режимі вибирати з ваших даних без заміни. Завантажувальний інструмент вибирає дані із заміною, тому одна і та ж дана може бути включена кілька разів, а деякі дані можуть взагалі не включатися. (На кожному "розділі" також буде N елементів, на відміну від K-кратного, у якому кожен розділ матиме N / K елементів.)
(Я мушу визнати, що я не знаю точно, як використовувався завантажувальний пристрій у резюме. Принцип тестування та резюме полягає у тому, щоб ви не перевіряли дані, на яких ви пройшли навчання, тому ви отримаєте більш реалістичне уявлення про те, як може працювати ваша техніка + коефіцієнти в реальному світі.)
EDIT: Замінено "Затримка не ефективна" на "Затримка не ефективно використовує ваші дані", щоб допомогти уточнити, за коментарями.