Термін "інваріант масштабу" означає тут наступне. Скажімо, у вас є зображення I , і ви виявили особливість (також точку інтересу) f в якомусь місці (x, y) та на деякому рівні масштабу s . Тепер скажімо, що у вас є зображення I ' , яке є масштабованою версією I (наприклад, зменшеною вибіркою). Тоді, якщо ваш детектор функцій є інваріантним за шкалою, ви повинні мати можливість виявити відповідну функцію f ' в I' у відповідному місці (x ', y') та відповідній шкалі s ' , де (x, y, s) і (x ', y', s ') пов'язані відповідною трансформацією масштабування.
Іншими словами, якщо ваш детектор інваріантних масштабів виявив точку функції, яка відповідає чиємусь обличчю, а потім ви збільшуєте або зменшуєте камеру на одній сцені, ви все одно повинні виявити точку функції на цьому обличчі.
Звичайно, ви також хочете "дескриптор функції", який би дозволив вам співставити дві функції, саме це дає вам SIFT.
Отож, ризикуючи вас заплутати далі, тут є дві речі, які не змінюють масштаб. Один з них - детектор точок інтересу DoG, який є інваріантним за масштабами, оскільки він виявляє особливості типу зображень (крапель) незалежно від їх масштабу. Іншими словами, детектор DoG виявляє краплі будь-якого розміру. Інша інваріантність масштабу - це дескриптор ознак, який є гістограмою градієнтної орієнтації, яка залишається більш-менш схожою для тієї ж характеристики зображення, незважаючи на зміну масштабу.
До речі, різниця гауссів використовується тут як наближення до фільтра Лаплаціана Гаусса.