Яка різниця між проблемою багатокласового і багаторівневою?
Яка різниця між проблемою багатокласового і багаторівневою?
Відповіді:
Я підозрюю, що різниця полягає в тому, що в задачах із кількома класами класи взаємно виключаються, тоді як для проблем із багатозазначеними позначеннями кожен ярлик являє собою іншу класифікаційну задачу, але завдання якимось чином пов'язані між собою (тому корисність вирішувати їх разом, а не окремо є користю ). Наприклад, у відомому наборі крабів лептограпуса є приклади чоловіків і жінок двох кольорових форм краба. Ви можете підходити до цього як до багатокласової проблеми з чотирма класами (чоловічий-синій, жіночий-синій, чоловічий-помаранчевий, жіночий-помаранчевий) або як проблема з декількома етикетками, де одна мітка буде чоловіком / жінкою, а інша синьою / помаранчевий. По суті, при проблемах з багатоматеріалами шаблон може належати до більш ніж одного класу.
Класифікація в багатьох класах означає класифікаційне завдання з більш ніж двома класами; наприклад, класифікуйте набір зображень фруктів, якими можуть бути апельсини, яблука чи груші. Класифікація багатокласових припускає, що кожен зразок присвоюється одній і лише одній етикетці: фрукт може бути або яблуком, або грушею, але не обома одночасно.
Багатозначна класифікація призначає кожному зразку набір цільових міток. Це може розглядатися як прогнозування властивостей точки даних, які не є взаємовиключними, наприклад, теми, що стосуються документа. Текст може бути про будь-яку релігію, політику, фінанси чи освіту одночасно, або жодне з них.
Взято з http://scikit-learn.org/stable/modules/multiclass.html
Щоб доповнити інші відповіді, ось кілька цифр. Один рядок = очікуваний вихід для одного зразка.
Один стовпець = один клас (одне гаряче кодування)
Один стовпець = один клас
Ви бачите це:
Як бічна примітка, ніщо не заважає вам мати проблему класифікації багатошарових класів , наприклад:
Проблема багатокласності має віднесення екземплярів до однієї з кінцевих взаємовиключних колекцій класів. Як і в прикладі, що вже подано крабів (від @Dikran): чоловічий-синій, жіночий-синій, чоловічий-помаранчевий, жіночий-помаранчевий. Кожен з них не включає інших, а разом узятий, вони є вичерпними.
Однією з форм багатозначної проблеми є поділ їх на дві етикетки, стать та колір; де секс може бути чоловічим або жіночим, а колір може бути синім або помаранчевим. Але зауважте, що це особливий випадок проблеми, пов’язаної з різними етикетками, оскільки кожен екземпляр отримує кожну мітку (тобто кожен краб має і стать, і колір).
Проблеми з декількома мітками включають також інші випадки, які дозволяють призначити змінну кількість міток кожному екземпляру. Наприклад, стаття в газетній або провідній службі може бути віднесена до категорій НОВИНИ, ПОЛІТИКА, СПОРТ, МЕДИЦИНА тощо. Однією історією про важливу спортивну подію було б присвоєно ярлик СПОРТ; в той час як інший, пов’язаний з політичною напруженістю, виявленою певним спортивним заходом, може отримати як етикетки СПОРТ, так і ПОЛІТИКУ. Там, де я є, у США результати Superbowl позначені як СПОРТ і НОВИНИ, враховуючи суспільний вплив події.
Зауважте, що ця форма маркування із змінною кількістю етикеток може бути перероблена у форму, схожу на приклад із крабами; за винятком того, що кожна мітка трактується як LABEL-X чи не-LABEL-X. Але не всі методи вимагають цього оновлення.
І ще одна відмінність полягає в тому, що проблема, що містить багато міток, вимагає, щоб модель вивчила взаємозв'язок між різними класами, але в проблемах з багатокласовими класами різні класи не залежать один від одного.