Чому показник f beta визначає бета так?


10

Це показник F бета:

Fβ=(1+β2)precisionrecall(β2precision)+recall

У статті Вікіпедії зазначено, що .Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

Я не здобув ідеї. Чому так визначати ? Чи можу я визначити так:F ββFβ

Fβ=(1+β)precisionrecall(βprecision)+recall

А як показати β times as much importance?


2
Ознайомтеся з новою відповіддю нижче, яка включає диференційне числення, яке стосується "чому бета- квадрат, а не бета-версія".
javadba

Відповіді:


19

Нехай - вага у першому наданому вами визначенні, а - вага у другому; два визначення є еквівалентними, коли ви встановлюєте , тому ці два визначення представляють лише нотаційні відмінності в визначення показника . Я бачив, як він визначав як перший спосіб (наприклад, на сторінці вікіпедії ), так і другий (наприклад, тут ).ββ~β~=β2Fβ

міра виходять, якщо взяти середні гармонійну точність і відкликання, а саме зворотні середнього значення зворотної точності і зворотний виклику:F1

F1=1121precision+121recall=2precisionrecallprecision+recall

Замість того, щоб використовувати в знаменнику ваги, що дорівнюють та дорівнюють 1 ( для виклику та для точності), ми можемо замість цього призначити ваги, які все ще дорівнюють 1, але для яка вага при відкликанні рази більша, ніж вага з точністю ( для відкликання та для точності). Це дає ваше друге визначення показника :1212βββ+11β+1Fβ

Fβ=11β+11precision+ββ+11recall=(1+β)precisionrecallβprecision+recall

Знову ж таки, якби ми використовували замість тут, ми б дійшли до вашого першого визначення, тому відмінності між двома визначеннями є просто умовними.β2β


1
чому вони помножили на термін точності замість терміна відкликання? β
Анварвіч

1
Диференціальне обчислення, яке стосується "чому бета- квадратик, а не бета-версія", включено в нову відповідь нижче.
javadba

@Anwarvic Вони множили із зворотним відкликанням. Після факторизації і розширюється з є термін влівоβ(1+β)precisionrecallβprecision
user2740

6

Причиною визначення показника F-beta за допомогою є саме цитата, яку ви надаєте (тобто, бажаючи надавати рази більше значення, щоб нагадати як точність), даючи конкретне визначення того, що означає додавати в рази більше важливості згадати, ніж точність.β2ββ

Конкретний спосіб визначення відносної важливості двох метрик, що призводить до формулювання можна знайти у пошуку інформації (Van Rijsbergen, 1979):β2

Визначення: відносне значення, яке користувач надає точності та відкликання, має відношення при якому , де - міра ефективності, заснована на точності та відкликанні.P/RE/R=E/PE=E(P,R)

Мотивація цього є:

Найпростіший спосіб, який я можу визначити, це вказати співвідношення при якому користувач готовий точно торгувати приріст для рівної втрати при відкликанні.P/R

Для того, щоб бачити , що це призводить до препарат можна почати із загальною формулою для зваженого гармонійного середнього і , і обчислити їх приватні похідні по відношенню до і . Джерело привів користей (для «ефективності заходів»), який знаходиться всього і пояснення еквівалентно , чи розглядається або .β2PRPRE1FEF

F=1(αP+1αR)

F/P=α(αP+1αR)2P2

F/R=1α(αP+1αR)2R2

Тепер, встановивши похідні дорівнюють один одному накладає обмеження на взаємозв'язку між і співвідношення . З огляду на те, що ми хочемо надати кратню величину, щоб нагадати як точність, ми розглянемо співвідношення 1 :αP/RβR/P

F/P=F/RαP2=1αR2RP=1αα

Визначення як цього співвідношення та перестановка для дає зважування у виразі :βαβ2

β=1ααβ2=1ααβ2+1=1αα=1β2+1

1α=11β2+1β2β2+1

Ми отримуємо:

F=1(1β2+11P+β2β2+11R)

Які можна переставити, щоб надати форму у вашому запитанні.

Таким чином, з урахуванням цитованого визначення, якщо ви хочете надати разів більше значення, щоб нагадати як точність, тоді слід використовувати формулу . Ця інтерпретація не дотримується, якщо використовується . Еквівалентною, менш інтуїтивно зрозумілою інтерпретацією у випадку, що ми просто використовуємо було б те, що ми хочемо надати разів більше значення, щоб нагадати як точність.ββ2βββ

Ви можете визначити результат, як ви пропонуєте, однак ви повинні знати, що в цьому випадку або обговорювана інтерпретація більше не відповідає, або ви маєте на увазі якесь інше визначення для кількісного визначення компромісу між точністю та відкликанням.

Виноски:

  1. P/R використовується в пошуку інформації, але це, здається, друкарня, див . Істину F-міри (Саскі, 2007).

Список літератури:

  1. CJ Van Rijsbergen. 1979. Інформаційний пошук (2-е видання), с.133-134
  2. Ю. Сасакі. 2007. «Правда міри F», Навчання, матеріали підручника

1
Це має бути прийнятою відповіддю.
javadba

3

Щоб швидко вказати на щось.

Це означає, що в міру збільшення бета-значення ви точно оцінюєте точність.

Насправді я думаю, що це навпаки - оскільки вищий кращий при оцінці F-β, ви хочете, щоб знаменник був малим. Отже, якщо ви зменшите β, то модель карається менше за хороший показник точності. Якщо ви збільшуєте β, то показник F-β карається більше, коли висока точність.

Якщо ви хочете зважити показник F-β так, щоб він визначав точність, β повинен бути 0 <β <1, де β-> 0 значить лише точність (чисельник стає дуже малим, і єдине, що в знаменнику - це нагадування, тому показник F-β зменшується у міру збільшення виклику).

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

Причина того, що β ^ 2 множиться з точністю, - це саме спосіб визначення F-балів. Це означає, що в міру збільшення бета-значення ви точно оцінюєте точність. Якщо ви хочете помножити його на виклик, який також би спрацював, це просто означатиме, що при збільшенні бета-значення ви більше нагадуєте.


0

Значення бета-версії більше 1 означає, що ми хочемо, щоб наша модель приділяла більше уваги моделі Recall порівняно з Precision. З іншого боку, значення менше 1 надає більше уваги точності.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.