Цікава відповідь пропонується тут:
https://github.com/dice-group/gerbil/wiki/Precision,-Recall-and-F1-measure
Автори вихідних модулів різних оцінок для точності і згадати в залежності від того , істинні позитивів, помилкові спрацьовування і помилкові негативи всіх 0. Якщо вони, результат нібито хороший.
У деяких рідкісних випадках обчислення точності або відкликання може спричинити поділ на 0. Що стосується точності, це може статися, якщо всередині відповіді анотатора немає результатів, і, таким чином, істинні, а також помилкові позитиви дорівнюють 0 . Для цих особливих випадків ми визначили, що якщо всі справжні позитивні, помилкові позитивні та хибні негативні значення 0, точність, відкликання та показник F1 - це 1. Це може статися у випадках, коли золотий стандарт містить документ без жодного анотації, а анотатор (правильно) не повертає приміток. Якщо справжні позитивні значення 0, а один з двох інших лічильників більший за 0, точність, відкликання та F1-міра дорівнюють 0.
Я не впевнений, чи вдасться цей вид скорингу корисний у інших ситуаціях поза їх спеціальним випадком, але варто подумати.