TLDR:
Мій набір даних досить малий (120) зразків. Коли я роблю 10-кратну перехресну перевірку, чи повинен я:
Зберіть результати з кожної тестової складки, об'єднайте їх у вектор, а потім обчисліть помилку на цьому повному векторі прогнозів (120 зразків)?
Або я повинен замість цього обчислити помилку на результатах, які я отримую за кожну складку (з 12 зразками на складку), а потім отримати остаточну оцінку помилки як середню оцінку 10 помилок у 10 разів?
Чи є якісь наукові праці, які аргументують відмінності між цими методами?
Передумови: Потенційне відношення до макро / мікро балів у класифікації на багато міток:
Я думаю, що це питання може бути пов’язане з різницею між мікро- та макро середніми показниками, які часто використовуються в задачі з класифікацією на багато міток (наприклад, 5 міток).
У налаштуваннях для багатьох міток обчислюються мікро середні бали , складаючи агреговану таблицю на випадок дійсних позитивних, помилкових позитивних, справжніх негативних, помилкових негативних результатів для всіх 5 прогнозів класифікатора на 120 вибірках. Ця таблиця надзвичайних ситуацій потім використовується для обчислення мікроточності, мікровідкликання та мікровимірювання. Отже, коли у нас є 120 зразків і п'ять класифікаторів, мікроміри обчислюються за 600 прогнозів (120 зразків * 5 міток).
Під час використання варіанту Макрос на кожному етикетці самостійно обчислюють заходи (точність, відкликання тощо), і, нарешті, ці заходи усереднюються.
Ідея, що лежить в основі різниці між оцінками мікро та макросу, може поширюватися на те, що можна зробити в K-кратному значенні в задачі бінарної класифікації. У 10 разів ми можемо або в середньому перевищити 10 значень ( вимірювання макросу ), або об'єднати 10 експериментів і обчислити мікро міри.
Фон - розширений приклад:
Наступний приклад ілюструє питання. Скажімо, у нас є 12 тестових зразків і 10 складок:
- Складіть 1 : TP = 4, FP = 0, TN = 8 Точність = 1,0
- Складіть 2 : TP = 4, FP = 0, TN = 8 Точність = 1,0
- Складіть 3 : TP = 4, FP = 0, TN = 8 Точність = 1,0
- Складіть 4 : TP = 0, FP = 12, Точність = 0
- Складіть 5 .. Складіть 10 : Усі мають однаковий TP = 0, FP = 12 і Precision = 0
де я використав такі позначення:
TP = # істинних позитивних, FP = # хибнопозитивних, TN = # істинних негативних
Результати:
- Середня точність в 10 разів = 3/10 = 0,3
- Точність конкатенації прогнозів у 10 разів = TP / TP + FP = 12/12 + 84 = 0,125
Зауважте, що значення 0,3 та 0,125 сильно відрізняються !