Нагадаємо, що функціональна форма логістичної регресії є
f( х ) =11 +е- (β0+β1х1+ ⋯ +βкхк)
Це те, що повертається predict_proba
.
Термін всередині експоненціалу
г(х ) =β0+β1х1+ ⋯ +βкхк
це те, що повертається decision_function
. "Гіперплан", про який йдеться в документації, є
β0+β1х1+ ⋯ +βкхк= 0
Ця термінологія є захопленням від підтримуючих векторних машин, які буквально оцінюють роздільну гіперплан. Для логістичної регресії ця гіперплан є дещо штучною конструкцією, це площина рівної ймовірності, де модель визначила, що обидва цільові класи однаково вірогідні.
predict
Функція повертає рішення класу з допомогою правила
f( х ) > 0,5
Загрожуючи мильною коробкою, predict
функція має дуже мало законних застосувань, і я вважаю, що це використовується як ознака помилки під час перегляду інших робіт. Я б зайшов досить далеко, щоб назвати це помилкою дизайну в самій sklearn ( predict_proba
функція повинна була бути викликана predict
і predict
повинна була бути викликана predict_class
, якщо вона взагалі є).