Як вірно стверджують інші відповіді, повідомлені ймовірності таких моделей, як логістична регресія та наївний Байєс, є оцінками ймовірності класу. Якби модель була правдивою, ймовірність справді була б ймовірністю правильної класифікації.
Однак досить важливо розуміти, що це може ввести в оману, оскільки модель оцінюється і, отже, не є правильною моделлю. Є щонайменше три випуски.
- Невизначеність оцінок.
- Помилкова модель.
- Упередження.
Невизначеність як раз скрізь присутній факт , що ймовірність є лише приблизними. Інтервал довіри передбачуваної ймовірності класу може дати деяке уявлення про невизначеність (про ймовірність класу, а не про класифікацію).
Якщо модель помилкова і зіткнетесь, це ймовірності класів можуть бути досить оманливими, навіть якщо прогнози класу хороші. Логістична регресія може призвести до помилок ймовірностей класу для двох досить добре розділених класів, якщо деякі точки даних трохи екстремальні. Це все ще може зробити гарну роботу з точки зору класифікації.−−
Якщо процедура оцінки (навмисно) дає необ’єктивну оцінку , ймовірності класу помилкові. Це те, що я бачу в таких методах регуляризації, як ласо та хребет для логістичної регресії. Незважаючи на те, що перехресне підтвердження вибору регуляризації призводить до моделі з хорошою ефективністю з точки зору класифікації, отримані ймовірності класів явно занижені (занадто близькі до 0,5) у тестових випадках. Це не обов'язково погано, але важливо пам’ятати.