Запитання з тегом «oversampling»

2
Класифікація тестування даних про незбалансований вибірки
Я працюю над сильно незбалансованими даними. У літературі використовується декілька методів, щоб збалансувати дані за допомогою повторного відбору вибірок (над- чи недостатня вибірка). Два хороших підходи: SMOTE: Техніка надмірного відбору синтетичних меншин ( SMOTE ) ADASYN: Адаптивний синтетичний підбір проб для збалансованого навчання ( ADASYN ) Я реалізував ADASYN, оскільки …

1
Думки про перенапруження в цілому і зокрема алгоритм SMOTE [закритий]
Закрито . Це питання ґрунтується на думці . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб на нього можна було відповісти фактами та цитатами, відредагувавши цю публікацію . Закрито 2 роки тому . Яка ваша думка щодо надмірного зразка в класифікації взагалі та алгоритму SMOTE зокрема? Чому …

2
Відбір проб із заміною на R randomForest
Реалізація randomForest не дозволяє відібрати вибірку за кількістю спостережень, навіть при вибірці з заміною. Чому це? Добре працює: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) Що я хочу зробити: rf <- randomForest(Species ~ ., iris, sampsize=c(51, 1, 1), replace=TRUE) …

1
SMOTE викидає помилку для багатокласової проблеми дисбалансу
Я намагаюся використовувати SMOTE для виправлення дисбалансу в моїй проблемі класифікації класів. Хоча SMOTE чудово працює на наборі даних райдужної оболонки відповідно до довідкового документа SMOTE, він не працює на подібному наборі даних. Ось як виглядають мої дані Зауважте, у ньому є три класи зі значеннями 1, 2, 3. > …

1
Перебіг з категоричними змінними
Мені хотілося б виконати комбінацію пересимплінгу та недооцінки, щоб збалансувати мій набір даних із приблизно 4000 клієнтами, розділеними на дві групи, де одна з груп становить приблизно 15%. Я вивчив SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) та ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), але обидва вони створюють нові синтетичні зразки, використовуючи існуючі спостереження …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.