Чи f-міра є синонімом точності?


11

Я розумію, що f-міра (заснована на точності та відкликання) - це оцінка того, наскільки точним є класифікатор. Крім того, f-міра віддається перевазі точності, коли у нас є неврівноважений набір даних. У мене просте запитання (яке стосується скоріше використання правильної термінології, ніж щодо технології). У мене незбалансований набір даних і я використовую f-мера в своїх експериментах. Я збираюся написати документ, який НЕ для конференції з машинного навчання / обміну даними. Отже, чи можу я в цьому контексті позначити f-вимірювання синонімічно з точністю. Наприклад, у мене f-міра 0,82, то чи можу я сказати, що мій класифікатор досягає 82% точних прогнозів?


Краще ввести f-міру, якщо ви його використовуєте. Заміна двох не є правильним з моєї точки зору. У вашому випадку, якщо ваша точність становить 99%, ви досягнете 99% точних прогнозів, незважаючи на те, що ваш показник f, і це може призвести читачів до помилок.
AdrienNK

@AdrienNK: 99% точність не означає 99% правильних прогнозів, якщо відносні частоти тестових випадків не такі, як у реальній ситуації із застосуванням.
cbeleites незадоволений SX

@cbeleites Ви маєте рацію, я знаю, але часто тестові випадки випускаються з одного і того ж дистрибутива (ну, можливо, це упереджений погляд на мене, тому що мені рідко доводилося працювати з даними, щодо яких це було не так)
AdrienNK

@AdrienNK: Я аналітичний хімік, який працює над медичними діагнозами. Поширеність захворювання, про яке йде мова, може змінюватися залежно від порядків між різними субпопуляціями пацієнтів. Дивіться, наприклад, обговорення різних ППВ у другій половині цієї статті: nature.com/news/2011/110323/full/471428a.html
cbeleites незадоволений SX

2
Це було захоплююче прочитання, дякую, що донесли це до моєї уваги.
AdrienNK

Відповіді:


13

Перш за все, я вважаю "точність" іноді трохи оманливою, оскільки це стосується різних речей:

Термін точність в генеральній оцінці систем або методів (я аналітичний хімік) відноситься до упередженості прогнозів, тобто відповідає на питання, наскільки хороші прогнози в середньому.

Як відомо, існує багато різних заходів щодо ефективності, які відповідають різним аспектам продуктивності класифікаторів. Один з них, як називається, і точність. Якщо ваш документ не призначений для аудиторії машинного навчання / класифікації, я рекомендую зробити це розрізнення дуже чітким. Навіть для цього більш конкретного значення точності я б дуже чітко пояснював те, що я називаю точністю, оскільки знову може виникнути кілька способів боротьби з дисбалансом класів. Зазвичай дисбаланс класів ігнорується, що призводить до загальновідомогоTP+TNall casesрозрахунок. Однак ви також можете використовувати середнє значення чутливості та специфічності, яке означає контроль дисбалансу класів шляхом зважування вашого середнього.

F-оцінка часто вводяться в якості гармонійного середнього точності і виклику (або позитивної прогностичної цінності та чутливості). Що стосується вашого запитання, я вважаю, що корисно прописати це трохи далі та спростити:

F=2precisionrecallprecision+recall=2TPall PTPallTTPall P+TPallT=2TP2all PallTTPall Tall PallT+TPall Pall PallT=2 TP2TPall T+TPall P=2 TPall T+all P

Останній вираз не є частиною нічого, що я можу вважати певною групою тестових випадків. Зокрема, очікується (важке) перекриття між справжніми та позитивними випадками. Це не дозволить мені виражати показник F у відсотках, оскільки це передбачає частку випадків. Власне, я думаю, я попередив би читача, що F-бал не має такої інтерпретації.


точніше це F1міра. F-бал можна узагальнити окремим параметром
qwr

0

Швидкий відповідь:

Ні, F-measureформула не складається з TNфактора, і вона корисна при пошуку задач (doc) .

Таким чином, це ( F-measure) правильний підхід до оцінки незбалансованих наборів даних або у випадку проблем із пошуком замість accuracyі ROC.

Accuracy = (TP+TN) / (TP+FP+FN+TN)

F1_Score = 2*(Recall * Precision) / (Recall + Precision)
# or
F1_Score = 2*TP / (2*TP + FP + FN)

[ ПРИМІТКА ]:

Precision = TP / (TP+FP)

Recall = TP / (TP+FN)
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.