Усереднення точності та відкликання при використанні перехресної перевірки


11

Я здійснив класифікацію, використовуючи декілька класифікаторів для даних, позначених двома класами, і використовував 5-кратну перехресну перевірку. На кожну складку я обчислював tp, tn, fp і fn. Тоді я підрахував точність, точність, відкликання та F-бал для кожного тесту. Моє запитання полягає в тому, що, коли я хочу оцінити результати, я взяв середнє значення точності, але чи можу я оцінити точність, згадку і F-бал? Або це було б математично неправильно? PS Набори даних, що використовуються у кожному складі, добре збалансовані за кількістю примірників на клас.

Дякую.


3
Я зіткнувся з вашою тією ж проблемою щодо обчислення вимірювальної величини F (середня гармонічна точність та відкликання) за допомогою перехресної перевірки. У цій роботі вони фактично продемонстрували, що обчислення F-міри на комплектації, а не усереднення, є менш упередженим методом. Я сподіваюся, що це може допомогти
papafe

3
@markusian Будь ласка, додайте це як відповідь! Це, безумовно, найважливіше на цій сторінці !!
drevicko

Відповіді:


2

Ж

Ж1=2точністьзгадатиточність+згадати
Жββ
Жβ=(1+β2)точністьзгадати(β2точність)+згадати
Ж

тЖЖ


Так, я використав першу формулу. Це означає, що усереднення F-балів у різних тестах дає аналогічні результати, як усереднення точності та згадування, а потім обчислення F-балу з них. Я спробував це на результатах, які у мене є, і це було майже однакове. Дякую.
Kalaji
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.