Найближче інтуїтивне значення f1-балу сприймається як середнє відкликання та точність. Розчистимо це для вас:
У класифікаційному завданні ви, можливо, плануєте побудувати класифікатор з високою точністю та згадувати. Наприклад, класифікатор, який говорить про те, чесна людина чи ні.
Для точності ви зазвичай можете точно сказати, скільки чесних людей там у певній групі. У цьому випадку, дбаючи про високу точність, ви припускаєте, що ви можете неправильно класифікувати брехун як чесну, але не часто. Іншими словами, тут ви намагаєтесь визначити брехуна від чесного як цілу групу.
Однак, нагадаємо, ви будете дуже стурбовані, якщо вважаєте брехункою чесною. Для вас це буде великою втратою і великою помилкою, і ви не хочете робити це знову. Крім того, це добре, якщо ви класифікували когось чесного як брехуна, але ваша модель ніколи не повинна (або здебільшого не робити) претендувати на брехуну як на чесну. Іншими словами, тут ви зосереджуєтесь на конкретному класі і намагаєтесь не помилитися з цим.
Тепер візьмемо випадок, коли ви хочете, щоб ваша модель (1) точно ідентифікувала чесного від брехуна (точність) (2) ідентифікувала кожну людину з обох класів (нагадуємо). Що означає, що ви оберете модель, яка буде добре працювати в обох показниках.
Ви прийняли рішення про вибір моделі, потім спробуємо оцінити кожну модель на основі середнього значення двох показників. F-Score - найкращий, який може описати це. Давайте подивимось на формулу:
Нагадаємо: p = tp / (tp + fp)
Нагадаємо: r = tp / (tp + fn)
F-оцінка: fscore = 2 / (1 / r + 1 / p)
Як бачите, чим вище виклик І точність, тим вищий F-бал.