Оригінальна публікація - http://rushdishams.blogspot.in/2011/08/micro-and-macro-average-of-precision.html
У Micro-середньому методі ви підсумовуєте індивідуальні справжні позитивні, помилкові позитивні та помилкові негативи системи для різних наборів та застосовуєте їх для отримання статистичних даних.
Хитрі, але мені це було дуже цікаво. Є два методи, за допомогою яких можна отримати таку середню статистику пошуку та класифікації інформації.
1. Мікро середній метод
У методі Micro-Середній ви підсумовуєте індивідуальні справжні позитивні, хибні позитивні та помилкові негативи системи для різних наборів та застосовуєте їх для отримання статистичних даних. Наприклад, для набору даних, системних
True positive (TP1) = 12
False positive (FP1) = 9
False negative (FN1) = 3
57.14%=TP1TP1+FP180%=TP1TP1+FN1
а для іншого набору даних - системи
True positive (TP2) = 50
False positive (FP2) = 23
False negative (FN2) = 9
Тоді точність (P2) і відкликання (R2) становитиме 68,49 і 84,75
Тепер середня точність та відкликання системи за допомогою методу Micro-Середня
Micro-average of precision=TP1+TP2TP1+TP2+FP1+FP2=12+5012+50+9+23=65.96
Micro-average of recall=TP1+TP2TP1+TP2+FN1+FN2=12+5012+50+3+9=83.78
Мікро середній показник F буде просто гармонійним середнім для цих двох фігур.
2. Макро середній метод
Метод прямо вперед. Просто візьміть середнє значення точності та згадування системи на різних множинах. Наприклад, макро середня точність та відкликання системи для даного прикладу є
Macro-average precision=P1+P22=57.14+68.492=62.82
Macro-average recall=R1+R22=80+84.752=82.25
Середній макро-F-бал буде просто гармонійним середнім для цих двох фігур.
Придатність Макро середній метод може бути використаний, коли ви хочете знати, як система працює в цілому по набору даних. Ви не повинні придумати якесь конкретне рішення з цим середнім показником.
З іншого боку, середня величина може бути корисним показником, коли ваш набір даних різниться за розміром.