Як і будь-яка метрика, хороша метрика - це краща, ніж "німа", випадково здогадатися, якщо вам доведеться здогадуватися, не маючи інформації про спостереження. Це називається в статистиці лише моделлю перехоплення.
Цей "німий" привід залежить від 2 факторів:
- кількість занять
- баланс класів: їх поширеність у спостережуваних даних
У випадку з показником LogLoss однією звичайною «добре відомою» метрикою є те, що 0,693 - це неінформативне значення. Ця цифра отримується шляхом передбачення p = 0.5
для будь-якого класу бінарної задачі. Це справедливо лише для збалансованих бінарних проблем . Тому що, коли поширеність одного класу становить 10%, то ви будете прогнозувати p =0.1
для цього класу завжди. Це буде вашою основою тупого, випадкового прогнозування, тому що прогнозування 0.5
буде більш тупим.
I. Вплив кількості класів N
на німий-logloss:
У збалансованому випадку (у кожного класу однакова поширеність), коли ви прогнозуєте p = prevalence = 1 / N
для кожного спостереження, рівняння стає просто:
Logloss = -log(1 / N)
log
буття Ln
, неперійський логарифм для тих, хто використовує цю умову.
У двійковому випадку N = 2
:Logloss = - log(1/2) = 0.693
Тож німі-Логлоси такі:
II. Вплив поширеності класів на тупого-логлоса:
а. Справа бінарної класифікації
У цьому випадку ми прогнозуємо завжди p(i) = prevalence(i)
, і отримуємо таку таблицю:
Отже, коли заняття дуже незбалансовані (поширеність <2%), логічність в 0,1 може насправді бути дуже поганою! Така точність в 98% була б поганою в цьому випадку. Тож, можливо, Logloss не буде найкращим показником для використання
б. Трикласна справа
"Тупий" -лолог залежно від поширеності - трикласний випадок:
Тут ми можемо побачити значення збалансованих двійкових та трикласних випадків (0,69 та 1,1).
ВИСНОВОК
Журнал 0,69 може бути хорошим у проблемі з багатокласовим і дуже поганим у двійковому упередженому випадку.
Залежно від вашого випадку, вам краще обчислити базову лінію проблеми, щоб перевірити сенс свого передбачення.
У упереджених випадках я розумію, що журнал лосс має ту саму проблему, що і точність та інші функції втрат: він забезпечує лише глобальне вимірювання вашої продуктивності. Тож вам краще доповнити своє розуміння показниками, орієнтованими на класи меншості (відкликання та точність), а може, і зовсім не використовувати логлос.