Як інтерпретувати криву ROC?


14

Я застосував логістичну регресію до своїх даних щодо SAS, і ось таблиця кривих і класифікація ROC.

введіть тут опис зображення

Мені подобається цифри в таблиці класифікації, але не зовсім впевнені, що показує крива roc та площа під нею. Будь-яке пояснення буде дуже вдячне.

Відповіді:


22

Коли ви робите логістичну регресію, вам дають два класи, кодовані як і . Тепер ви обчислюєте ймовірності того, що з урахуванням деяких пояснювальних варіантів людина належить до класу, кодованого як . Якщо ви виберете поріг ймовірності та класифікуєте всіх осіб із ймовірністю, що перевищує цей поріг, як клас та нижче як10110, ви в більшості випадків будете робити деякі помилки, оскільки зазвичай дві групи не можуть бути дискриміновані ідеально. Для цього порогу тепер можна обчислити свої помилки та так звану чутливість та специфічність. Якщо ви робите це для багатьох порогів, ви можете побудувати криву ROC, побудувавши чутливість проти 1-Специфічності для багатьох можливих порогів. Область під кривою грає, якщо ви хочете порівняти різні методи, які намагаються розмежувати два класи, наприклад, дискримінантний аналіз або пробіт-модель. Ви можете побудувати криву ROC для всіх цих моделей, а та, яка має найвищу площу під кривою, може розглядатися як найкраща модель.

Якщо вам потрібно глибше зрозуміти, ви також можете прочитати відповідь на інше питання щодо кривих ROC, натиснувши тут.


Чим площа під кривою ROC відрізняється від правильної норми в таблиці класифікації?
Günal

2
У таблиці показано лише правильне та невірне для одного порогу. Однак крива AUROC є мірою повного методу класифікації та правильного та невірного для багатьох різних порогових значень.
random_guy

Радий це чути!
random_guy

6

AUC в основному лише повідомляє вам, як часто випадкове витяг з вашої передбачуваної ймовірності відповіді на ваших 1-мітних даних буде більшим, ніж випадкове витяг з вашої передбачуваної ймовірності відповіді на ваших 0-мічених даних.


6

Модель логістичної регресії - метод прямої оцінки ймовірностей. Класифікація не повинна грати ніякої ролі при її використанні. Будь-яка класифікація, що не ґрунтується на оцінці комунальних послуг (функція втрат / витрат) за окремими предметами, є недоцільною, за винятком надзвичайних надзвичайних ситуацій. Крива ROC тут не корисна; не є чутливістю або специфічністю, які, як і загальна точність класифікації, є невідповідними правилами оцінювання точності, які оптимізовані хибною моделлю, що не відповідає максимальній оцінці ймовірності.

c15pYp0,05


@Frank Harrell: Не могли б ви детальніше розглянути розрахунок щодо перехоплення, а також коментар щодо похибки. Дякую!
липень

@FrankHarrell робить вашу пораду, що нам потрібно застосовувати принаймні 15p спостереження, якщо ми в кінцевому підсумку робимо регресію хребта для калібрування моделі? Моє розуміння полягає в тому, що ми замінюємо p на ефективні розміри.
Lepidopterist

Правильно, і я б сказав, що ви використовуєте пеналізацію, наприклад, квадратичний (гребінний) штраф, щоб оцінити параметри, що призводить до кращої калібрування
Френк Харрелл

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.