Запитання з тегом «class-imbalance»

2
чому нам потрібно обробляти дисбаланс даних?
Мені потрібно знати, чому нам потрібно мати справу з дисбалансом даних. Я знаю, як впоратися з цим і різними методами вирішити проблему, яка полягає у вибіранні або зменшенні вибірки або за допомогою Smote. Наприклад, якщо у мене рідкісне захворювання - 1 відсоток із 100, і скажемо, що я вирішив створити …

2
Коли ми говоримо, що набір даних не підлягає класифікації?
Я багато разів аналізував набір даних, на якому я не міг зробити жодної класифікації. Щоб побачити, чи можу я отримати класифікатор, я зазвичай використовую такі кроки: Створіть графіки графіки мітки проти числових значень. Зменшіть розмірність до 2 або 3, щоб побачити, чи розділяються класи, також іноді пробуйте LDA. Намагайтеся налаштувати …

3
Коли нам слід вважати набір даних незбалансованим?
Я стикаюся з ситуацією, коли кількість позитивних та негативних прикладів у наборі даних є незбалансованим. Моє запитання: чи існують якісь принципові правила, які підказують нам, коли нам слід підпробовувати велику категорію, щоб змусити якесь врівноваження в наборі даних. Приклади: Якщо кількість позитивних прикладів становить 1000, а кількість негативних прикладів - …

1
Категоризація підходів для боротьби з незбалансованими класами
Який найкращий спосіб класифікувати підходи, розроблені для вирішення проблеми класу дисбалансу? Ця стаття класифікує їх на: Попередня обробка: включає в себе передискретизацію, піддискретизацію та гібридні методи, Навчання, що залежить від затрат: включає прямі методи та мета-навчання, які останнє ділить на порог та вибірку, Ансамблеві прийоми: включає в себе рентабельні ансамблі …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.