Можливо, простіший випадок зробить все зрозумілішими. Скажімо, ми обираємо вибірку пікселів 1x2 замість 100x100.
Зразки пікселів із зображення
+----+----+
| x1 | x2 |
+----+----+
Уявіть собі, будуючи графік нашого навчального набору, ми помітили, що його не можна легко розділити лінійною моделлю, тому ми вирішимо додати поліноміальні терміни, щоб краще відповідати даним.
Скажімо, ми вирішуємо побудувати наші поліноми, включивши всі інтенсивності пікселів і всі можливі кратні, які можуть бути сформовані з них.
Оскільки наша матриця мала, давайте перерахуємо їх:
х1, х 2, х 21, х 22, х 1× х2, х 2× х1
Інтерпретуючи описану вище послідовність ознак, можна побачити, що існує закономірність. Перші два терміни, група 1, - це особливості, що складаються лише з їх інтенсивності пікселів. Наступні два терміни після цього, група 2, - це ознаки, що складаються з квадрата їх інтенсивності. Останні два терміни, група 3, - це добуток усіх комбінацій попарно (двох) пікселів інтенсивності.
група 1:х1, х 2
група 2:х21, х 22
група 3:х1× х2, х 2× х1
Але зачекайте, є проблема. Якщо ви подивитесь на 3 групи в послідовності ( та ), ви помітите, що вони рівні. Згадайте наш приклад житла. Уявіть, що для одного будинку є дві функції x1 = квадратний кадр та x2 = квадратний кадр ... Це не має сенсу! Гаразд, тому нам потрібно позбутися функції дублювання, давайте скажемо довільно . Тепер ми можемо переписати список трьох функцій групи як:х1× х2x2×x1x2×x1
група 3:x1×x2
Підраховуємо функції у всіх трьох групах і отримуємо 5.
Але це іграшковий приклад. Давайте отримаємо загальну формулу для обчислення кількості ознак. Давайте використаємо наші вихідні групи функцій як вихідну точку.
sizegroup1+sizegroup2+sizegroup3=m×n+m×n+m×n=3×m×n
Ах! Але нам довелося позбутися продубльованого продукту у групі 3.
Тому для правильного підрахунку функцій для групи 3 нам знадобиться спосіб підрахунку всіх унікальних парних продуктів у матриці. Що можна зробити за допомогою біноміального коефіцієнта, що є методом підрахунку всіх можливих унікальних підгруп розміром k з рівної або більшої групи розмірів n. Тож для правильного підрахунку ознак у групі 3 обчислюємо .C(m×n,2)
Отже, наша загальна формула буде:
m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)
Давайте використовувати його для обчислення кількості функцій у нашому прикладі іграшок:
2×1×2+C(1×2,2)=4+1=5
Це воно!