У мене є кілька прогнозних моделей, продуктивність яких я хотів би зробити тест зворотним (тобто взяти мій набір даних, "перемотати" його до попереднього моменту часу і побачити, як модель могла б працювати в перспективі).
Проблема полягає в тому, що деякі мої моделі були побудовані за допомогою інтерактивного процесу. Наприклад, слідуючи порадам у Стратегії моделювання регресії Франка Харрелла , в одній моделі я використовував обмежені кубічні сплайси для обробки можливих нелінійних асоціацій між ознаками та відповіддю. Я виділив ступені свободи кожного сплайну на основі поєднання доменних знань та універсальних заходів міцності асоціації. Але ступінь свободи, яку я хочу дозволити своїй моделі, очевидно, залежить від розміру набору даних, який різко змінюється при повторному тестуванні. Якщо я не хочу вручну вибирати ступінь свободи кожен раз, коли модель підтверджується, які ще мої варіанти?
Для іншого прикладу, я зараз працюю над виявленням зовнішньої форми через пошук точок з високим важелем. Якби я із задоволенням це робив вручну, я просто перегляну кожну точку даних із високим важелем, перевірити, чи дані вони чисті, і фільтрувати їх, або очищати вручну. Але це покладається на купу знань про домен, тому я не знаю, як автоматизувати процес.
Я вдячний порадам та рішенням: (a) загальної проблеми автоматизації інтерактивних частин процесу побудови моделі, або (b) конкретних порад для цих двох випадків. Дякую!