Я хочу моделювати логістичну регресію з незбалансованими даними (9: 1). Я хотів спробувати параметр ваг у glm
функції у R, але я не на 100% впевнений, що це робить.
Скажімо, моя вихідна змінна c(0,0,0,0,0,0,0,0,0,1)
. тепер я хочу надати «1» вагу в 10 разів більше. тому я навожу аргумент ваг weights=c(1,1,1,1,1,1,1,1,1,1,1,10)
.
Коли я це зроблю, це буде враховано при розрахунку максимальної ймовірності. Чи правий я? неправильна класифікація "1" - це лише в 10 разів гірше, ніж помилкова класифікація "0".