Як отримати імовірнісну інтерпретацію AUC?


14

Чому область під кривою ROC вірогідність того, що класифікатор класифікує випадково вибраний "позитивний" екземпляр (із отриманих прогнозів) вище, ніж випадково обраний "позитивний" (від початкового позитивного класу)? Як можна довести це твердження математично, використовуючи інтеграл, даючи CDF та PDF справжнього розподілу класів на позитивні та негативні?


2
Я написав тут дуже елементарний доказ цього: madrury.github.io/jekyll/update/statistics/2017/06/21/…
Matthew Drury

Відповіді:


10

Спочатку спробуємо формально визначити площу під кривою ROC. Деякі припущення та визначення:

  • У нас є ймовірнісний класифікатор, який видає "бал" s (x), де x - риси, а s - це родова зростаюча монотонна функція оціненої ймовірності p (клас = 1 | x).

  • fk(s)k={0,1}Fk(s)

  • Класифікація нового спостереження отримується порівнянням балів s до порогу t

Крім того, для зручності математики розглянемо позитивний клас (виявлена ​​подія) k = 0, а від'ємний k = 1. У цьому налаштуванні ми можемо визначити:

  • F0(t)
  • 1F1(t)
  • F1(t)

F0(t)F1(t)v=F1(s)

AUC=01F0(F11(v))dv
dv=f1(s)ds
AUC=F0(s)f1(s)ds

Ця формула може бути сприйнята як ймовірність того, що випадково намальований член класу 0 виробить бал, менший за рахунок випадково намальованого члена 1 класу.

Цей доказ взято з: https://pdfs.semanticscholar.org/1fcb/f15898db36990f651c1e5cdc0b405855de2c.pdf


5

@ alebu відповідь чудова. Але його позначення є нестандартним і використовує 0 для позитивного класу та 1 для негативного класу. Нижче наведені результати для стандартних позначень (0 для негативного класу та 1 для позитивного класу):

f0(s)F0(s)

f1(s)F1(s)

x(s)=1F0(s)

y(s)=1F1(s)

AUC=01y(x)dx=01y(x(τ))dx(τ)=+y(τ)x(τ)dτ=+(1F1(τ))(f0(τ))dτ=+(1F1(τ))f0(τ)dτ

τ


1

τ

  1. A
  2. BA
  3. τ

P(A>τ)P(B>τ)

τAUC

Ми отримуємо:

AUC=01TPR(x)dx=01P(A>τ(x))dx
xxTPR

(1)AUC=Ex[P(A>τ(x))]
xU[0,1)

xFPR

x=FPR=P(B>τ(x))
x

P(B>τ(x))U
=>P(B<τ(x))(1U)U
(2)=>FB(τ(x))U

XFX(Y)UYX

FX(X)=P(FX(x)<X)=P(X<FX1(X))=FXFX1(X)=X

τ(x)B

Підставивши це до рівняння (1), отримаємо:

AUC=Ex(P(A>B))=P(A>B)

Іншими словами, площа під кривою є ймовірністю того, що випадкова позитивна вибірка матиме більш високий бал, ніж випадкова негативна вибірка.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.