Зв'язки між (d-prime) та AUC (Площа під кривою ROC); основні припущення


13

У машинному навчанні ми можемо використовувати область під кривою ROC (часто скорочено AUC або AUROC), щоб підсумувати, наскільки добре система може розрізняти дві категорії. У теорії виявлення сигналу часто (індекс чутливості) використовується з подібною метою. Обидва тісно пов'язані між собою, і я вважаю, що вони рівноцінні один одному, якщо певні припущення будуть задоволені .d

розрахунок, як правило , представлений на основі припущення нормальних розподілів для розподілів сигналів (див вікіпедії посилання вище, наприклад). Розрахунок кривої ROC не передбачає цього припущення: він застосовний до будь-якого класифікатора, який виводить критерій рішення безперервного значення, який може бути поріг.d

У Вікіпедії сказано, що еквівалентно . Це здається правильним, якщо припущення обох задовольняються; але якщо припущення не однакові, це не є універсальною істиною. 2 AUC - 1d2AUC1

Чи справедливо характеризувати різницю припущень, оскільки "AUC робить менше припущень щодо базових розподілів"? Або насправді так само широко застосовується, як AUC, але це просто звичайна практика, що люди, які використовують як правило, використовують обчислення, яке передбачає звичайні розподіли? Чи є якісь інші відмінності в основних припущеннях, які я пропустив?d 'dd

Відповіді:


7

Ні. Максимальне значення AUC становить 1. d 'не має максимуму.

Я вважаю, що d 'дорівнює qnorm (AUC) * sqrt (2) (мою пам'ять про стару книгу статистики я зараз не можу знайти, але, здається, перевіряє деякі дані, які я знайшов в Інтернеті). Тут qnorm (x) - "квантильна функція для нормального розподілу" (R-говорить). Тобто він повертає значення нормального розподілу, для якого частка x розподілу знаходиться нижче нього.


2
Дякую, це звучить правильно для мене - проте, лише якщо ми вважаємо, що розподіли є нормальними (через використання qnorm ()). Я виправив формулювання wikipedia.
Ден Стоуелл
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.