Важливо розуміти, що після вилучення ключових точок ви отримуєте лише інформацію про їх положення , а іноді і про зону їх покриття (як правило, наближену до кола або еліпса) на зображенні. Хоча інформація про положення ключових точок іноді може бути корисною, вона не говорить дуже багато про самі ключові точки.
Залежно від алгоритму, який використовується для вилучення ключових точок (SIFT, Harris corners, MSER), ви будете знати деякі загальні характеристики витягнутих ключових точок (наприклад, вони зосереджені навколо крапок, країв, видатних кутів ...), але ви не знатимете, наскільки різні або схожий один ключовий пункт - інший.
Ось два прості приклади, коли тільки область позиції та ключової точки нам не допоможе:
Якщо у вас є зображення A (ведмедя на білому тлі) та інше зображення B, точна копія A, але перекладена на кілька пікселів: вилучені ключові точки будуть однаковими (на тій же частині цього ведмедя). Ці два зображення слід визнати однаковими чи подібними.
Але, якщо єдина інформація, яку ми маємо, - це їхнє положення, і це змінилося через переклад, ви не можете порівнювати зображення.
Якщо у вас є зображення A (скажімо, качки цього разу) та інше зображення B, точно така ж качка, як у A, за винятком подвійного розміру: вилучені ключові точки будуть однаковими (однакові частини качки). Це теж однакові (подібні) зображення.
Але всі їх розміри (області) будуть різними: усі ключові точки зображення B будуть вдвічі більшими за розміри з зображення А.
Отже, сюди приходять дескриптори : вони є способом порівняння ключових точок. Вони у векторному форматі (постійної довжини) узагальнюють деякі характеристики щодо ключових точок. Наприклад, це може бути їх інтенсивність у напрямку їх найбільш вираженої орієнтації. Він присвоює числовий опис області зображення, на яку посилається ключова точка.
Деякі важливі речі для дескрипторів:
вони повинні бути незалежними від позиції ключових точок
Якщо однакова ключова точка витягується в різних положеннях (наприклад, через переклад), дескриптор повинен бути однаковим.
вони повинні бути стійкими до перетворень зображення
Деякі приклади - це зміни контрасту (наприклад, зображення того самого місця під час сонячного та похмурого дня) та зміни точки зору (зображення будівлі з правого центру та зліва в центрі, ми все одно хотіли б визнати його як однакову будівлю) .
Звичайно, жоден дескриптор не є надійним проти всіх перетворень (ані проти жодної, якщо вона сильна, наприклад, великі зміни в перспективі).
Різні дескриптори розроблені таким чином, щоб бути стійкими до різних перетворень, що іноді протиставляється швидкості, необхідній для їх обчислення.
вони повинні бути масштабними незалежними
Дескриптори повинні враховувати масштаб. Якщо "видатною" частиною однієї ключової точки є вертикальна лінія 10 пікселів (всередині кругової області з радіусом 8 пікселів), а видатна частина іншої вертикальної лінії 5 пікс (всередині кругової області з радіусом 4 пікселя) - цим ключовим точкам слід призначити подібні дескриптори.
Тепер, коли ви обчислили дескриптори для всіх ключових точок, у вас є спосіб порівняти ці ключові точки . Для простого прикладу відповідності зображень (коли ви знаєте, що зображення є одним і тим же об'єктом, і ви хочете визначити частини в різних зображеннях, які зображують ту саму частину сцени, або хочете визначити зміну точки зору між двома зображеннями) , ви б порівняли кожен дескриптор ключових точок одного зображення з кожним дескриптором ключових точок іншого зображення. Оскільки дескриптори є векторами чисел, ви можете порівнювати їх з чимось простим, як евклідова відстань, . Є, звичайно, кілька більш складних відстаней, які можна використовувати як міру подібності. Але, врешті-решт, ви б це сказалиключові точки, дескриптори яких мають найменшу відстань між ними, є збігами , наприклад , ті ж «місця» або «частини об'єктів» в різних образах.
Для більш складного використання ключових точок / дескрипторів вам слід поглянути на це питання - особливо "місцевий підхід низького рівня" у моїй відповіді та підхід "Мішок слова" у відповіді @Maurits . Також корисні посилання, надані в цих відповідях.