TL; DR
Точність - це неправильне оцінювання. Не використовуйте його.
Трохи довша версія
Власне, точність - це навіть не правило. Тож запитати, чи правильно це (строго) - це помилка категорії. Найбільше, що можна сказати, - це те, що при додаткових припущеннях точність узгоджується з правилом підрахунку, яке є неправильним, переривчастим та оманливим. (Не використовуйте його.)
Ваша плутанина
Ваша плутанина випливає з того, що втрати неправильної класифікації відповідно до паперу, який ви цитуєте, також не є правилом оцінки.
Деталі: правила оцінки та класифікаційні оцінки
Давайте зафіксуємо термінологію. Нас цікавить двійковий результат , і у нас є ймовірнісний прогноз . Ми знаємо, що , але наша модель може чи не може цього знати.y∈{0,1}qˆ=Pˆ(Y=1)∈(0,1)P(Y=1)=η>0.5qˆ
Правило скорингу є відображенням , яке приймає імовірнісний прогноз і результат до втрати,qˆy
s:(qˆ,y)↦s(qˆ,y).
s є правильним, якщо він оптимізований в очікуванні . ("Оптимізований" зазвичай означає "мінімізований", але деякі автори перевертають знаки і намагаються максимально скористатися правилом зарахування.) є строго правильним, якщо його оптимізують у очікуванні лише через .qˆ=ηsqˆ=η
Зазвичай ми оцінюємо за багатьма прогнозами та відповідними результатами та середнім для оцінки цього очікування.sqˆiyi
Тепер, що таке точність ? Точність не сприймає ймовірнісного прогнозу як аргументу. Для цього потрібна класифікаціяyˆ∈{0,1} та результат:
a:(yˆ,y)↦a(yˆ,y)={1,0,yˆ=yyˆ≠y.
Тому точність - це не правило . Це класифікаційна оцінка. (Це термін, який я щойно вигадав; не шукайте цього в літературі.)
Тепер, звичайно, ми можемо взяти ймовірнісний прогноз, як наш і перетворити його на класифікацію . Але для цього нам знадобляться додаткові припущення, про які говорилося вище. Наприклад, дуже часто використовувати поріг та класифікувати:qˆyˆθ
yˆ(qˆ,θ):={1,0,qˆ≥θqˆ<θ.
Дуже поширене порогове значення - . Зауважимо, що якщо ми будемо використовувати цей поріг, а потім оцінювати точність за багатьма прогнозами (як вище) та відповідними результатами , то ми точно доходимо до втрати від неправильної класифікації, згідно Buja та ін. Таким чином, втрата від класифікації також не є правилом оцінки, а класифікаційною оцінкою.θ=0.5qˆiyi
Якщо взяти алгоритм класифікації, як описаний вище, ми можемо перетворити оцінку класифікації в правило оцінювання. Справа в тому, що нам потрібні додаткові припущення класифікатора. І ця втрата точності чи неправильної класифікації або будь-яка інша оцінка класифікації, яку ми обираємо, може менше залежати від імовірнісного прогнозу і більше від того, як ми перетворимо на класифікацію . Таким чином, оптимізація оцінки класифікації може бути переслідувана за червоною оселедець, якщо ми насправді зацікавлені в оцінці .qˆqˆyˆ=yˆ(qˆ,θ)qˆ
Тепер, що неправомірно в цих правилах підрахунку балів-під додатковими припущеннями? У цьому випадку нічого. , під неявним , дозволить досягти максимальної точності та мінімізувати втрати під час класифікації за всі можливі . Отже, у цьому випадку наші припущення щодо підрахунку правил, недопущення додаткових припущень є правильними.qˆ=ηθ=0.5qˆ∈(0,1)
Зауважте, що для точності чи втрати неправильної класифікації важливо лише одне питання: чи класифікуємо ( ) все як клас більшості чи ні? yˆЯкщо ми це зробимо, точність або втрата неправильної класифікації задоволені. Якщо ні, то вони ні. Що важливо в цьому питанні, це те, що він має лише дуже неглибокий зв’язок з якістю .qˆ
Отже, наші припущення щодо додаткового припущення не є строго належними, оскільки будь-яке призведе до тієї ж класифікаційної оцінки. Ми можемо використовувати стандарт , вважаючи, що клас більшості відбувається з і класифікуємо все як клас більшості, тому що . Точність висока, але ми не маємо стимулу вдосконалити наш до правильного значення .thetas=0,5 кв =0,99 кв ≥thetas ; д ηqˆ≥θθ=0.5qˆ=0.99qˆ≥θqˆη
Або ми, можливо, провели обширний аналіз асиметричних витрат на помилкову класифікацію і вирішили, що найкращим порогом ймовірності класифікації насправді повинен бути . Наприклад, це може статися, якщо означає, що ви страждаєте від якоїсь хвороби. Можливо, буде краще лікувати вас, навіть якщо ви не страждаєте від захворювання ( ), а не навпаки, тому може бути доцільним лікувати людей, навіть якщо є низька прогнозована ймовірність (мала ) вони страждають від цього. Тоді ми можемо мати жахливо помилкову модель, яка вважає, що справжній клас більшості відбувається лише зу = 1 у = 0 д д = 0,25 кв ≥ & thetas ;θ=0.2y=1y=0qˆqˆ=0.25- але через витрати на помилкову класифікацію ми все-таки класифікуємо все як цей (припускається) міноритарний клас, тому що знову . Якби ми це зробили, точність або втрата неправильної класифікації змусили б нас повірити, що ми робимо все правильно, навіть якщо наша прогнозована модель навіть не зрозуміє, який з наших двох класів є більшістю.qˆ≥θ
Тому точність або втрати неправильної класифікації можуть вводити в оману.
Крім того, точність та втрата неправильної класифікації є невідповідними згідно з додатковими припущеннями у більш складних ситуаціях, коли результати не є ідентичними. Френк Харрелл у своєму блозі Пошкодження, заподіяні класифікаційною точністю та іншими переривчастими правилами непідвладного точного відліку, наводить приклад з однієї з своїх книг, де використання точності або втрати неправильної класифікації призведе до неправильної моделі, оскільки вони не оптимізовані правильним умовним прогнозуванням ймовірність.
Ще одна проблема з точністю та втратами неправильної класифікації полягає в тому, що вони перериваються як функція порогу . Френк Харрелл теж займається цим.θ
Додаткову інформацію можна знайти на Чому точність не є найкращим показником для оцінки класифікаційних моделей? .
Суть
Не використовуйте точність. Ні втрати від неправильної класифікації.
Нітпік: "строгий" проти "строго"
Чи варто говорити про "суворі" правильні правила скорингу, або про "строго" правильні правила скорингу? "Строгий" змінює "належне", а не "правило скорингу". (Існують "правильні правила скорингу" та "строго правильні правила скорингу", але немає "суворих правил скорингу".) Як таке, "суворо" має бути прислівник, а не прикметник, і "суворо" слід використовувати. Як це часто зустрічається в літературі, наприклад, праці Тильмана Гнейтінга.