Наскільки життєздатним було б класифікувати текстуру зображення, використовуючи функції дискретного косинусного перетворення? Гуглінг "dct" класифікація текстур "знаходить лише одну наукову роботу на цю тему, використовуючи нейронну мережу.
Для мого застосування у мене є великий корпус із позначеними зображеннями, в якому все зображення має стійку текстуру (наприклад, знімки з макро, ковдри, кори дерева, трав'янистого поля тощо).
Натхненний відповіддю на попереднє запитання , я розглядав наступний підхід:
- розділити кожне зображення на NxN блоки пікселів
- взяти DCT кожного блоку
- вирівняти кожен DCT в масив 1xM і подати його в алгоритм кластеризації K-Means і отримати мітку кластера для кожного DCT
- обчислити гістограму кластеризації міток для кожного зображення, підрахувавши кожну мітку на зображення від №3
- тренувати класифікатор SVM, подаючи йому набір [(гістограма, мітка зображення)]
Як добре це би працювало? Я реалізував подібну систему, використовуючи функції, витягнуті за допомогою алгоритмів SIFT / SURF, але мені вдалося отримати лише близько 60% точності.
Якими іншими способами я міг би використовувати DCT для класифікації текстур?