Я вивчаю курс машинного навчання, а слайди лекцій містять інформацію, що мені суперечить рекомендованій книзі.
Проблема полягає в наступному: є три класифікатори:
- класифікатор A, що забезпечує кращі показники роботи в нижньому діапазоні порогів,
- класифікатор B, що забезпечує більш високу продуктивність у більш високому діапазоні порогів,
- класифікатор C, що ми отримуємо, перегортаючи p-монету та вибираючи з двох класифікаторів.
Якою буде продуктивність класифікатора C, який розглядається на кривій ROC?
У слайдах лекції зазначається, що, просто перегорнувши цю монету, ми отримаємо магічний « опуклий корпус » кривої ROC класифікатора A та B.
Я не розумію цього моменту. Як ми просто перевернемо монету, як ми можемо отримати інформацію?
Слайд лекції
Про що йдеться в книзі
Рекомендована книга (« Збір даних ...» Й. Х. Віттена, Ейбе Франка та Марка А. Холла ), з іншого боку, говорить:
Щоб побачити це, виберіть конкретне обмеження ймовірності для методу A, який дає справжню та хибну позитивну швидкість tA та fA відповідно, та інше відсічення для методу B, що дає tB та fB. Якщо ви використовуєте ці дві схеми навмання з ймовірностями p і q, де p + q = 1, то ви отримаєте істинні та хибні додатні показники p. tA + q. тБ і р. fA + q. fB. Це являє собою точку, що лежить на прямій, що з'єднує точки (tA, fA) і (tB, fB), і, змінюючи p і q, ви можете простежити всю лінію між цими двома точками.
Наскільки я розумію, те, що йдеться в книзі, полягає в тому, що, щоб насправді отримати інформацію та досягти опуклого корпусу, нам потрібно зробити щось більш вдосконалене, ніж просто перевернути п-монету.
AFAIK, правильний спосіб (як пропонується у книзі) полягає в наступному:
- нам слід знайти оптимальний поріг Oa для класифікатора A
- нам слід знайти оптимальний поріг Ob для класифікатора B
визначте С таким чином:
- Якщо t <Oa, використовуйте класифікатор A з t
- Якщо t> Ob, використовуйте класифікатор B з t
- Якщо Oa <t <Ob, виберіть між класифікатором A з Oa і B з Ob ймовірність як лінійну комбінацію того, де ми знаходимось між Oa і Ob.
Це правильно? Якщо так, то є кілька ключових відмінностей порівняно з тим, що слайди пропонують.
- Це не просто гортання монети, а більш досконалий алгоритм, який потребує визначених вручну точок і вибирає залежно від того, в який регіон ми потрапляємо.
- Він ніколи не використовує класифікатор A і B з пороговими значеннями між Oa та Ob.
Чи можете ви пояснити мені цю проблему і який правильний спосіб її зрозуміти , якщо моє розуміння було невірним?
Що буде, якби ми просто перевернули монети p, як запропонували слайди? Я думаю, що ми отримаємо криву ROC, яка знаходиться між A і B, але ніколи "кращою", ніж краща в даній точці.
Наскільки я бачу, я дійсно не розумію, як слайди можуть бути правильними. Імовірнісний розрахунок ліворуч для мене не має сенсу.
Оновлення: знайдено статтю, написану оригінальним автором, який винайшов метод опуклого корпусу: http://www.bmva.org/bmvc/1998/pdf/p082.pdf