Чи можна контролювати вартість помилкової класифікації в пакеті R randomForest ?
У моїй власній роботі хибні негативи (наприклад, помилки, що у людини може бути захворювання) набагато дорожчі, ніж помилкові позитиви. Пакет rpart дозволяє користувачеві контролювати витрати на помилкову класифікацію, визначаючи матрицю втрат, щоб по-різному визначити неправильні класифікації. Чи існує щось подібне randomForest
? Чи повинен я, наприклад, використовувати classwt
параметр для управління критерієм Джині?
classwt
: Так, я виявив, що на практиці та відповідно до інших користувачів результати не такі, як очікувалося. (iii)cutoff
: Мені не зрозуміло, як використовуватиcutoff
в цьому випадку, і я бажаю будь-якої подальшої поради.