Яка різниця між функцією прийняття рішення, прогнозом_проблемою та функцією передбачення для проблеми логістичної регресії?


10

Я переглядав документацію sklearn, але не можу зрозуміти мету цих функцій в контексті логістичної регресії. Бо decision_functionвін говорить, що його відстань між гіперпланом і тестовим екземпляром. чим корисна ця конкретна інформація? і як це стосується predictта predict-probaметодів?

Відповіді:


29

Нагадаємо, що функціональна форма логістичної регресії є

f(х)=11+е-(β0+β1х1++βкхк)

Це те, що повертається predict_proba.

Термін всередині експоненціалу

г(х)=β0+β1х1++βкхк

це те, що повертається decision_function. "Гіперплан", про який йдеться в документації, є

β0+β1х1++βкхк=0

Ця термінологія є захопленням від підтримуючих векторних машин, які буквально оцінюють роздільну гіперплан. Для логістичної регресії ця гіперплан є дещо штучною конструкцією, це площина рівної ймовірності, де модель визначила, що обидва цільові класи однаково вірогідні.

predictФункція повертає рішення класу з допомогою правила

f(х)>0,5

Загрожуючи мильною коробкою, predictфункція має дуже мало законних застосувань, і я вважаю, що це використовується як ознака помилки під час перегляду інших робіт. Я б зайшов досить далеко, щоб назвати це помилкою дизайну в самій sklearn ( predict_probaфункція повинна була бути викликана predictі predictповинна була бути викликана predict_class, якщо вона взагалі є).


Дякую за відповідь . " ?
Те саме,

Це пояснення цікаве та корисне. Я б хотів, щоб Склеарн пояснив це краще. Що я не розумію - це користь пізнання значення x у логістичній функції 1 / (1 + e ^ -x)? Все, що я можу придумати, - це можливо використовувати іншу сигмоподібну функцію, як x / (1+ | x |). Чи є більше? Дякую!
ldmtwo

В основному функцією прийняття рішення повинна була бути сигмоїда в логістичній регресії. Правильно?
3nomis

2
Я думаю, що причина того, що @Matthew знаходиться в мильній коробці, полягає в тому, що використання 0,5 в якості порогу прогнозування є наївним. Перше, що слід зробити, це навчитися використовувати перехресну валідацію, криві ROC та AUC для вибору відповідного порогу c та використання функції рішення f (x)> c.
hwrd
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.