Чи це не призводить до надмірної підгонки? Чи були б мої результати більш надійними, якби я додав процедуру підключення ножа або завантажувальну машину до складу аналізу?
Чи це не призводить до надмірної підгонки? Чи були б мої результати більш надійними, якби я додав процедуру підключення ножа або завантажувальну машину до складу аналізу?
Відповіді:
Я думаю, що скласти модель та протестувати її - це різні речі. Відставання назад є частиною побудови моделі. Для його тестування більше використовуються джек-ніж і завантажувач.
Ви, звичайно, можете мати більш достовірні оцінки за допомогою завантажувального пристрою та джек-ножа, ніж просте зворотнє вилучення. Але якщо ви дійсно хочете перевірити придатність, то найкращим випробуванням є розділений зразок, тренування на одних, тестування на інші. Для цієї мети занадто нестабільний / недостовірний: http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html
Я думаю, щонайменше 10% суб'єктів потребують отримання більш стабільних оцінок надійності моделі. А якщо у вас 20 предметів, 2 предметів ще дуже мало. Але тоді виникає питання, чи є у вас достатньо великий зразок, щоб побудувати модель, яку можна застосувати до решти населення.
Сподіваюся, він відповів на ваше запитання хоча б частково.