k -складна перехресна перевірка
Припустимо, у вас є 100 точок даних. Для k кратної перехресної валідації ці 100 балів поділяються на k рівних за розміром та взаємовиключні 'складки'. Для k = 10, ви можете призначити точки 1-10 для складання №1, 11-20 для складання №2 і так далі, закінчуючи, присвоївши точки 91-100, щоб скласти №10. Далі ми вибираємо одну складку, яка виступатиме в якості тестового набору, а решту k−1 складок використовуємо для формування навчальних даних. Для першого запуску ви можете використовувати точки 1-10 як тестовий набір і 11-100 як навчальний набір. Наступний пробіг тоді використовує точки 11-20 в якості тестового набору і тренується на балах 1-10 плюс 21-100 тощо, поки кожна складка не буде використана один раз як тестовий набір.
Перевірка хрестовини Монте-Карло
Монте-Карло працює дещо інакше. Ви випадково вибираєте (без заміни) деяку частину своїх даних для формування навчального набору, а потім присвоюєте решту балів тестовому набору. Потім цей процес повторюється багато разів, щоразу створюючи (навмання) нові навчальні та тестові розділи. Наприклад, припустимо, ви вибрали використовувати 10% своїх даних в якості тестових даних. Тоді у вашому тестовому наборі для представника №1 можуть бути пункти 64, 90 , 63, 42 , 65, 49, 10, 64, 96 та 48. На наступний запуск ваш тестовий набір може становити 90 , 60, 23, 67, 16, 78, 42 , 17, 73 та 26. Оскільки розділи виконуються незалежно для кожного запуску, одна і та сама точка може з’являтися в тестовому наборі кілька разів,що є основною різницею між Монте-Карло та перехресною валідацією .
Порівняння
У кожного методу є свої переваги та недоліки. Під час перехресної перевірки кожна точка перевіряється рівно один раз, що здається справедливим. Однак перехресне підтвердження вивчає лише декілька можливих способів розподілу ваших даних. Монте-Карло дозволяє вивчити дещо більш можливі розділи, хоча ви навряд чи отримаєте їх усі - є можливі способи 50/50 розділити 100 точок даних встановити (!).(10050)≈1028
Якщо ви намагаєтесь зробити висновок (тобто статистично порівняти два алгоритми), усереднення результатів виконання перебігу кратної перехресної перевірки отримує (майже) неупереджену оцінку продуктивності алгоритму, але з великою дисперсією (як ви розраховуйте мати лише 5 чи 10 точок даних). Оскільки ви, в принципі, можете виконувати його так довго, як хочете / можете собі дозволити, перехресне підтвердження Монте-Карло може дати вам меншу змінну, але більш упереджену оцінку.k
Деякі підходи сплавляють ці два, як у перехресній валідації 5х2 (див. Діетріх (1998) для цієї ідеї, хоча, думаю, з тих пір були якісь вдосконалення), або шляхом виправлення упередженості (наприклад, Nadeau та Bengio, 2003 ) .