Питання досить розпливчасте, тому я припускаю, що ви хочете вибрати відповідний показник продуктивності для порівняння різних моделей. Для хорошого огляду ключових відмінностей між кривими ROC та PR, ви можете ознайомитись із наступним документом: Взаємозв'язок кривих Precision-Recall та ROC від Девіса та Годріха .
Процитуйте Девіса і Годріха:
Однак при роботі з сильно перекошеними наборами даних криві Precision-Recall (PR) дають більш інформативну картину продуктивності алгоритму.
Графік кривих ROC FPR проти TPR. Щоб бути більш чітким:
Криві PR - точність графіку проти відкликання (FPR), або більш чітко:
ЖПR = FПЖП+ ТN,ТПR = TПТП+ FN.
r e c a l l = TПТП+FN= ТПR ,p r e c i s i o n = TПТП+FП
На точність безпосередньо впливає (не) баланс класу, оскільки це впливає на , тоді як TPR залежить лише від позитивних результатів. Ось чому криві ROC не фіксують таких ефектів.ЖП
Криві точності відкликання краще виділити відмінності між моделями для сильно незбалансованих наборів даних. Якщо ви хочете порівняти різні моделі в незбалансованих налаштуваннях, площа під кривою PR, ймовірно, матиме більші відмінності, ніж площа під кривою ROC.
Однак, криві ROC зустрічаються набагато частіше (навіть якщо вони менш підходять). Залежно від вашої аудиторії, криві ROC можуть бути лінгва-франка, тому використання їх, мабуть, більш безпечний вибір. Якщо одна модель повністю домінує над іншою в просторі PR (наприклад, завжди має більш високу точність над усім діапазоном відкликання), вона також буде домінувати в просторі ROC. Якщо криві перетинаються в будь-якому просторі, вони будуть перетинатися і в іншому. Іншими словами, основні висновки будуть подібними незалежно від того, яку криву ви використовуєте.
Безсоромна реклама . Як додатковий приклад, ви можете подивитися на один із моїх робіт, в яких я повідомляю про криві ROC та PR у незбалансованому режимі. Фіг.3 містить криві ROC та PR для однакових моделей, чітко показуючи різницю між цими двома. Для порівняння площі під PR та площі під ROC можна порівняти таблиці 1-2 (AUPR) та таблиці 3-4 (AUROC), де можна побачити, що AUPR показує значно більші відмінності між окремими моделями, ніж AUROC. Це ще раз підкреслює придатність кривих PR.