Попередні відповіді справді чудові, я хотів би зазначити ще кілька доповнень:
Сегментація об’єктів
одна з причин того, що це впало в немилість дослідницького співтовариства, полягає в тому, що це проблематично розмито. Сегментація об’єктів раніше означала просто знаходження однієї або невеликої кількості об’єктів на зображенні та проведення межі навколо них, і для більшості цілей ви все ще можете припустити, що це означає це. Однак він також почав застосовуватися для означання сегментації крапок, які можуть бути об'єктами, сегментації об'єктів із заднього плану (частіше зараз називається фоновим відніманням або сегментацією фону або виявленням переднього плану), і навіть у деяких випадках використовується взаємозамінно з розпізнаванням об'єктів за допомогою обмежувальних полів (це швидко припиняється з появою глибоких нейромережевих підходів до розпізнавання об'єктів, але заздалегідь розпізнавання об'єктів також може означають просто позначення цілого зображення з об'єктом у ньому).
Що робить "сегментацію" "семантичною"?
Simpy кожному сегменту, або у випадку глибоких методів кожному пікселю, присвоюється мітка класу на основі категорії. Сегментація загалом - це лише поділ зображення за якимось правилом. Наприклад, сегментація середнього зсуву , наприклад, з дуже високого рівня, поділяє дані відповідно до змін енергії зображення. Графік вирізанийСегментація на основі аналогічно не вивчається, але безпосередньо походить від властивостей кожного зображення, окремо від решти. Більш пізні методи (засновані на нейронних мережах) використовують пікселі, які позначені мітками, щоб навчитися ідентифікувати локальні особливості, пов’язані з певними класами, а потім класифікувати кожен піксель, виходячи з того, який клас має найвищу довіру до цього пікселя. Таким чином, "маркування пікселів" насправді є більш чесною назвою для завдання, і компонент "сегментація" з'являється.
Сегментація екземпляра
Можливо, найскладніше, актуальне та оригінальне значення сегментації об’єктів, „сегментація екземпляра” означає сегментацію окремих об’єктів у межах сцени, незалежно від того, чи вони однакові. Однак одна з причин, чому це настільки складно, полягає в тому, що з точки зору бачення (і певним чином філософського) те, що робить екземпляр "об'єкта", не зовсім зрозуміле. Частини тіла є предметами? Чи слід взагалі сегментувати такі "часткові об'єкти" за допомогою алгоритму сегментації екземплярів? Чи слід їх сегментувати, лише якщо їх бачити окремо від цілого? А як щодо складених предметів, якщо дві речі повинні чітко сусідяти, але розділяти один-два предмети (це камінь, приклеєний до верху палиці сокирою, молотком або просто палицею та скелею, якщо це не зроблено належним чином?). Крім того, це не t зрозуміло, як розрізнити екземпляри. Заповіт є окремим екземпляром від інших стін, до яких він прикріплений? В якому порядку слід враховувати екземпляри? Як вони з’являються? Близькість до точки зору? Незважаючи на ці труднощі, сегментація предметів все ще є великою справою, тому що, як люди, ми постійно взаємодіємо з об'єктами незалежно від їх "мітки класу" (використовуючи випадкові предмети навколо вас як паперові гирі, сидячи на речах, які не є стільцями), і тому деякі набори даних намагаються розібратися в цій проблемі, але головна причина, що проблемі поки не приділяється багато уваги, полягає в тому, що вона недостатньо чітко визначена.
Розбір сцени / Позначення сцени
Розбір сцени - це суворо сегментований підхід до маркування сцен, який також має деякі власні проблеми невизначеності. Історично маркування сцени мало на меті розділити всю "сцену" (зображення) на сегменти і дати їм усім мітку класу. Однак це також використовувалося в значенні надання міток класів областям зображення без явного їх сегментування. Стосовно сегментації, "семантична сегментація" не означає поділу всієї сцени. Для семантичної сегментації алгоритм призначений для сегментування лише тих об'єктів, які він знає, і буде покараний функцією втрат для позначення пікселів, які не мають міток. Наприклад, набір даних MS-COCO - це набір даних для семантичної сегментації, де сегментовано лише деякі об’єкти.