Розгорнута стратегія може покращити продуктивність вашої моделі, тому варто спробувати. Що стосується додаткового / онлайн-навчання, я не знаю жодного пакету в R, який його реалізує (інші, будь ласка, виправте мене, якщо я помиляюся). У Scikit Learn є позакласні класифікатори, які дозволяють поступово навчатись. Однак якщо ви прив’язані до використання R, у вас, можливо, не залишиться нічого іншого, як написати власну додаткову модель. У будь-якому випадку, вивчаючи позапрофільні класифікатори Scikit Learn, можна дати вам уявлення про те, з чого почати.
Ще одна деталь, яку слід пам’ятати, - ступінь оновлення моделі на один хибний позитивний чи хибний негатив покращить продуктивність моделі. У сфері шахрайства, як правило, тисячі до мільйонів разів більше випадків не шахрайства, ніж шахрайства. Отже, важливо намагатися навчитися правильно розмежувати кожен екземпляр шахрайства, але оновлення моделі на одному екземплярі шахрайства, ймовірно, не змінить модель суттєво. Розглянемо інші стратегії для того, щоб модель надала більше значення випадкам шахрайства.
Найпростішим способом вдосконалення вашої контрольованої моделі, заснованої на зворотній зв’язку з людськими слідчими, було б побудувати окрему модель від виправлених випадків (тобто випадки, передбачені неправильно, які були належним чином марковані). Тоді ви зможете дві моделі "проголосувати" за класифікацію майбутніх екземплярів шляхом узагальнення їх передбачуваних членських класів. Наприклад, ModelA може вважати, що Instance1 є [Шахрайство: 0,65, Не шахрайство: 0,35], тоді як ModelB вважає, що Instance1 є [Шахрайство: 0,47, Не шахрайство: 0,53]. Таким чином, передбачення ансамблю буде [Шахрайство: (0,65 + 0,47) /2=0,56, Не шахрайство: (0,35 + 0,53) /2=0,44].
Якщо ваша оригінальна модель працює краще, ніж випадкові, кількість примірників, які вона правильно класифікує, буде більшою, ніж кількість неправильно класифікованих. Таким чином, ви не хочете надавати однаковій вазі моделям, якщо вони навчаються на непропорційній кількості примірників. Для вирішення цієї невідповідності є два простих варіанти: 1) зачекайте, поки ви накопичите достатньо виправлених екземплярів, щоб приблизно дорівнювати кількості, на яких навчалась початкова модель, або 2) присвоїти вагу кожній моделі на основі того, як модель працює на валідаційному наборі.