Скажімо, у нас є класифікатор SVM, як ми генеруємо криву ROC? (Як теоретично) (тому що ми створюємо TPR і FPR з кожним порогом). І як ми визначаємо оптимальний поріг для цього класифікатора SVM?
Скажімо, у нас є класифікатор SVM, як ми генеруємо криву ROC? (Як теоретично) (тому що ми створюємо TPR і FPR з кожним порогом). І як ми визначаємо оптимальний поріг для цього класифікатора SVM?
Відповіді:
Використовуйте класифікатор SVM для класифікації набору анотованих прикладів, і "одна точка" на просторі ROC на основі одного прогнозування прикладів може бути ідентифікована. Припустимо, кількість прикладів 200, спочатку порахуйте кількість прикладів чотирьох випадків.
Потім обчисліть TPR (справжній позитивний показник) і FPR (хибний позитивний показник). , і F P R = 28 / ( 28 + 44 ) = 0,3889 На просторі ROC вісь x - FPR, а вісь y - TPR. Отже, точка ( 0,3889 .
Щоб намалювати криву ROC, просто
(1) Відрегулюйте деяке порогове значення, яке керує кількістю прикладів, позначених істинними або хибними
Наприклад, якщо концентрація певного білка вище α% означає захворювання, різні значення α дають різні кінцеві значення TPR та FPR. Порогові значення можна просто визначити способом, подібним до пошуку в сітці; накресліть приклади навчання з різними пороговими значеннями, класифікуйте класи з різними наборами мічених прикладів, запустіть класифікатор на тестових даних, обчисліть значення FPR та виберіть порогові значення, що охоплюють низький (близький до 0) та високий (близький до 1) FPR значення, тобто близькі до 0, 0,05, 0,1, ..., 0,95, 1
(2) Створіть безліч наборів приміток із примітками
(3) Запустіть класифікатор на множинах прикладів
(4) Обчисліть точку (FPR, TPR) для кожного з них
(5) Накресліть остаточну криву ROC
Деякі деталі можна перевірити на веб-сайті http://en.wikipedia.org/wiki/Receiver_operating_characteristic .
Крім того, ці два посилання корисні щодо того, як визначити оптимальний поріг. Простий метод - це прийняти той, який має максимальну суму справжніх позитивних та помилкових негативних показників. Інші більш чіткі критерії можуть включати інші змінні, що включають різні пороги, такі як фінансові витрати тощо.
Http://www.medicalbiostatistics.com/roccurve.pdf
http://www.kovcomp.co.uk/support/XL-Tut/life-ROC -curves-приймач-операційний-характеристика.html
Дійсно простий спосіб вибрати поріг - це взяти середні передбачувані значення позитивних випадків для тестового набору. Це стає вашим порогом.
Поріг наближається до того самого порогу, який ви отримаєте, використовуючи криву roc, де перекриваються справжня позитивна швидкість (tpr) і 1 - хибнопозитивна швидкість (fpr). Цей крос tpr (крос) 1-fpr максимізує справжній позитивний, мінімізуючи помилкові негативи.