Яка різниця між багатокласовою задачею та багаторівневою задачею


52

Яка різниця між проблемою багатокласового і багаторівневою?


Обидва завдання можна виконати за допомогою програмного пакету Vowpal Wabbit (командний рядок, прив'язки пітона).
Владислав Довгалець

Я дізнався цю концепцію і вибудував своє розуміння на цій посаді , вони пояснили класифікацію мульти-етикетки дуже елегантно.
користувач235077

Відповіді:


45

Я підозрюю, що різниця полягає в тому, що в задачах із кількома класами класи взаємно виключаються, тоді як для проблем із багатозазначеними позначеннями кожен ярлик являє собою іншу класифікаційну задачу, але завдання якимось чином пов'язані між собою (тому корисність вирішувати їх разом, а не окремо є користю ). Наприклад, у відомому наборі крабів лептограпуса є приклади чоловіків і жінок двох кольорових форм краба. Ви можете підходити до цього як до багатокласової проблеми з чотирма класами (чоловічий-синій, жіночий-синій, чоловічий-помаранчевий, жіночий-помаранчевий) або як проблема з декількома етикетками, де одна мітка буде чоловіком / жінкою, а інша синьою / помаранчевий. По суті, при проблемах з багатоматеріалами шаблон може належати до більш ніж одного класу.


@Dirkran Дякую за ваше пояснення. Чи знаєте ви будь-яке інше джерело, де я можу отримати багатонаціональний набір даних, окрім csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.html та mulan.sourceforge.net/datasets.html
Учень

@Learner вибачте, це не те, над чим я багато працював. Можливо, ви хочете ознайомитись із навчанням у багатьох завданнях, яке має певну схожість із навчанням на багато міток. Можливо, деякі з наборів даних, що використовуються для цього, також можуть бути корисними як орієнтири для навчання на багато міток.
Дікран Марсупіал

26

Класифікація в багатьох класах означає класифікаційне завдання з більш ніж двома класами; наприклад, класифікуйте набір зображень фруктів, якими можуть бути апельсини, яблука чи груші. Класифікація багатокласових припускає, що кожен зразок присвоюється одній і лише одній етикетці: фрукт може бути або яблуком, або грушею, але не обома одночасно.

Багатозначна класифікація призначає кожному зразку набір цільових міток. Це може розглядатися як прогнозування властивостей точки даних, які не є взаємовиключними, наприклад, теми, що стосуються документа. Текст може бути про будь-яку релігію, політику, фінанси чи освіту одночасно, або жодне з них.

Взято з http://scikit-learn.org/stable/modules/multiclass.html


18

Щоб доповнити інші відповіді, ось кілька цифр. Один рядок = очікуваний вихід для одного зразка.

Мультиклас

Один стовпець = один клас (одне гаряче кодування)

введіть тут опис зображення

Багатозначний

Один стовпець = один клас

введіть тут опис зображення


Ви бачите це:

  • у випадку з багатозначним позначенням одному зразку може бути призначено більше одного класу.
  • у випадку багатокласовості загалом понад 2 класи.

Як бічна примітка, ніщо не заважає вам мати проблему класифікації багатошарових класів , наприклад:

введіть тут опис зображення


7

Проблема багатокласності має віднесення екземплярів до однієї з кінцевих взаємовиключних колекцій класів. Як і в прикладі, що вже подано крабів (від @Dikran): чоловічий-синій, жіночий-синій, чоловічий-помаранчевий, жіночий-помаранчевий. Кожен з них не включає інших, а разом узятий, вони є вичерпними.

Однією з форм багатозначної проблеми є поділ їх на дві етикетки, стать та колір; де секс може бути чоловічим або жіночим, а колір може бути синім або помаранчевим. Але зауважте, що це особливий випадок проблеми, пов’язаної з різними етикетками, оскільки кожен екземпляр отримує кожну мітку (тобто кожен краб має і стать, і колір).

Проблеми з декількома мітками включають також інші випадки, які дозволяють призначити змінну кількість міток кожному екземпляру. Наприклад, стаття в газетній або провідній службі може бути віднесена до категорій НОВИНИ, ПОЛІТИКА, СПОРТ, МЕДИЦИНА тощо. Однією історією про важливу спортивну подію було б присвоєно ярлик СПОРТ; в той час як інший, пов’язаний з політичною напруженістю, виявленою певним спортивним заходом, може отримати як етикетки СПОРТ, так і ПОЛІТИКУ. Там, де я є, у США результати Superbowl позначені як СПОРТ і НОВИНИ, враховуючи суспільний вплив події.

Зауважте, що ця форма маркування із змінною кількістю етикеток може бути перероблена у форму, схожу на приклад із крабами; за винятком того, що кожна мітка трактується як LABEL-X чи не-LABEL-X. Але не всі методи вимагають цього оновлення.


2

І ще одна відмінність полягає в тому, що проблема, що містить багато міток, вимагає, щоб модель вивчила взаємозв'язок між різними класами, але в проблемах з багатокласовими класами різні класи не залежать один від одного.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.