Перш за все, я вважаю "точність" іноді трохи оманливою, оскільки це стосується різних речей:
Термін точність в генеральній оцінці систем або методів (я аналітичний хімік) відноситься до упередженості прогнозів, тобто відповідає на питання, наскільки хороші прогнози в середньому.
Як відомо, існує багато різних заходів щодо ефективності, які відповідають різним аспектам продуктивності класифікаторів. Один з них, як називається, і точність. Якщо ваш документ не призначений для аудиторії машинного навчання / класифікації, я рекомендую зробити це розрізнення дуже чітким. Навіть для цього більш конкретного значення точності я б дуже чітко пояснював те, що я називаю точністю, оскільки знову може виникнути кілька способів боротьби з дисбалансом класів. Зазвичай дисбаланс класів ігнорується, що призводить до загальновідомогоTP+TNall casesрозрахунок. Однак ви також можете використовувати середнє значення чутливості та специфічності, яке означає контроль дисбалансу класів шляхом зважування вашого середнього.
F-оцінка часто вводяться в якості гармонійного середнього точності і виклику (або позитивної прогностичної цінності та чутливості). Що стосується вашого запитання, я вважаю, що корисно прописати це трохи далі та спростити:
F=2⋅precision⋅recallprecision+recall=2TPall PTPallTTPall P+TPallT=2TP2all P⋅allTTP⋅all Tall P⋅allT+TP⋅all Pall P⋅allT=2 TP2TP⋅all T+TP⋅all P=2 TPall T+all P
Останній вираз не є частиною нічого, що я можу вважати певною групою тестових випадків. Зокрема, очікується (важке) перекриття між справжніми та позитивними випадками. Це не дозволить мені виражати показник F у відсотках, оскільки це передбачає частку випадків. Власне, я думаю, я попередив би читача, що F-бал не має такої інтерпретації.