У простій класифікації ми маємо два класи: клас-0 та клас-1. У деяких даних у мене є лише значення для класу-1, тому жодне для класу-0. Зараз я думаю про створення моделі для моделювання даних для 1 класу. Отже, коли з'являються нові дані, ця модель застосовується до нових даних і знаходить ймовірність, яка говорить про те, наскільки ймовірні, що нові дані відповідають цій моделі. Тоді, порівнюючи з порогом, я можу відфільтрувати невідповідні дані.
Мої запитання:
- Це хороший спосіб працювати з такими проблемами?
- Чи можна використовувати класифікатор RandomForest для цього випадку? Чи потрібно мені додавати штучні дані для класу-0, які, сподіваюся, класифікатор вважає шумом?
- Будь-яка інша ідея може допомогти для цієї проблеми?