Чи коефіцієнт кубика такий, як точність?


13

Я натрапляю на коефіцієнт кістки для подібності обсягу ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) та точності ( https://en.wikipedia.org/wiki/Accuracy_and_precision ).

Мені здається, що ці два заходи однакові. Будь-які думки?


1
Це надає всю інформацію stats.stackexchange.com/questions/195006/…
rank1

1
@ rank1 Дякую Хочу уточнити: чи не посилання на моє запитання :)
RockTheStar

Відповіді:


18

Це не одне і те ж, і їх часто використовують у різних контекстах. Оцінка Dice часто використовується для кількісної оцінки ефективності методів сегментації зображень . Там ви анотуєте деяку область основної істини на своєму зображенні, а потім складаєте автоматизований алгоритм для цього. Ви затверджуєте алгоритм, обчислюючи бал Dice, який є показником того, наскільки схожі об'єкти. Отже, це розмір перекриття двох сегментів, поділених на загальний розмір двох об'єктів. Використовуючи ті ж самі терміни, що й опис точності, оцінка Dice - це:

Dice score=2number of true positives2number of true positives + number of false positives + number of false negatives
Отже, кількість справжніх позитивних результатів - це число, яке знайде ваш метод, кількість позитивних даних - це загальна кількість позитивних результатів, які можна знайти, а кількість помилкових позитивних результатів - кількість балів, негативних, які ваш метод класифікує як позитивний.

Оцінка Dice - це не лише показник кількості позитивних результатів, але й штрафує за помилкові позитиви, знайдені методом, аналогічно точності. тому він більше схожий на точність, ніж на точність. Єдина відмінність - це знаменник, де ви маєте загальну кількість позитивів, а не лише позитиви, які знайде метод. Таким чином, оцінка Dice також штрафує за позитиви, які ваш алгоритм / метод не зміг знайти.

Редагувати: У разі сегментації зображення, скажімо, що у вас є маска з основною істиною, назвемо маску як ви запропонували. Отже, маска має значення 1 у пікселях, де є щось, що ви намагаєтесь знайти, а інше - нульове. Тепер у вас є алгоритм для створення зображення / маски , який також повинен бути двійковим зображенням, тобто ви створюєте маску для себе сегментації. Тоді ми маємо наступне:AB

  • Кількість позитивних даних - загальна кількість пікселів, що мають інтенсивність 1 на зображенніA
  • Кількість справжніх позитивних даних - це загальна кількість пікселів, у яких значення і є значенням 1 . Так що перетин областей в них і . Це те ж саме , як з допомогою оператора І на і .ABABAB
  • Кількість помилкових спрацьовувань цього кількість пікселів , які з'являються як 1 в , але нуль в .BA

Якщо ви робите це для публікації, тоді напишіть Dice з великої літери D, оскільки вона названа на честь хлопця на ім’я Dice.

EDIT: Щодо коментаря про виправлення: я не використовую традиційну формулу для обчислення коефіцієнта кубика, але якщо я перекладу її на нотацію в іншій відповіді, це стає:

Dice score=2|AB|2|AB|+|BA|+|AB|

Що еквівалентно традиційному визначенню. Зручніше писати це так, як я його написав спочатку, щоб викласти формулу з точки зору помилкових позитивних результатів. Нахил - це встановлений мінус.


2
Дякую за відповідь. Саме для порівняння сегментації зображень. Отже, цей бал із кістки використовується, скажімо, для зображення A та зображення B. Зображення A - це справжня основа (0 або 1), а зображення B - моя сегментація. Отже, яка загальна кількість позитивних (1), це те, що число 1 в A + число 1 в B ?? Я тут трохи розгублений. Те саме, що помилковий позитив
RockTheStar

1
@RockTheStar Я відредагую свою відповідь на рахунок для сегментації зображень.
Гумео

1
Чудово, дякую за ваше пояснення. Ще одне наступне питання. А як щодо діапазону D? Це між 0 і 1?
RockTheStar

2
Щиро дякую!
Здійснимо

2
@Gumeo, ви можете виправити або принаймні пояснити свою відповідь, дивіться детальну інформацію про мою нову відповідь
dvb

20

Коефіцієнт кістки (також відомий як індекс подібності кубика) такий самий, як і показник F1 , але це не тотожність точності. Основна відмінність може полягати в тому, що точність враховує справжні негативи, тоді як коефіцієнт кубика та багато інших заходів просто обробляють справжні негативи як нецікаві за замовчуванням (див . Основи оцінки класифікатора, частина 1 ).

Наскільки я можу сказати, коефіцієнт кубика не обчислюється так, як описано в попередній відповіді , яка фактично містить формулу індексу Жакарда (також відома як "перетин між союзом" в комп'ютерному зорі).

Dice(A,B)=2|AB||A|+|B|F1(A,B)=2|A|/|AB|+|B|/|AB|Jaccard(A,B)=|AB||max(A,B)|=|AB||A|+|B||AB|Accuracy(A,B)=|AB|+|A¯B¯||All|

Там, де двійкові вектори (зі значеннями 1 для елементів всередині групи та 0 в іншому випадку), один означає основну істину, а інший означає результат класифікації, а - просто всі елементи, що розглядаються (бінарний вектор 1-х однакових довжина). Наприклад,(внутрішній добуток і ) - кількість справжніх позитивних,(внутрішній добуток комплементу і доповнення ) - це кількість справжніх негативів.A l l | A B | А Б | ¯ A¯ B | А БA,BAll|AB|AB|A¯B¯|AB

Коефіцієнт Dice та індекс Жаккарда монотонно пов'язані, а індекс Тверського узагальнює їх обоє, щоб прочитати більше про нього, див. F-бали, Dice та Jacardard .

Коефіцієнт кубика - це також гармонічне середнє значення Чутливості та Точності, щоб дізнатися, чому це має сенс, прочитайте Чому F-міра є гармонічним середнім, а не середнім арифметичним заходами точності та відкликання? .

Щоб дізнатися більше про багато термінів у цій відповіді та їх взаємозв'язку, див. Оцінка двійкових класифікаторів .

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.