Проблема, про яку я спочатку обговорював тут , розвинулася і, можливо, стала трохи простішою, коли я вивчала її ще в деяких випадках і отримувала нову інформацію.
Підсумок, я хотів би мати можливість виявити цю картину, показану тут, використовуючи методи комп’ютерного зору / обробки зображень. Як бачите, ідеальний візерунок складається з чотирьох «пінгів». Розпізнавання об'єкта повинно бути:
- Зміна інваріантна
- Горизонтально зображення буде циклічним. (тобто, натисніть праворуч, виходить зліва і навпаки).
- (На щастя) Вертикально, це не циклічно. (тобто натисніть на верхню або нижню частину, і вона зупиниться).
- Інваріант масштабу (пінг може змінюватись в "товщині", як ви бачите.)
Я можу продовжувати і продовжувати це робити, але я додав зображення, що стосуються того, що я маю на увазі, будь ласка, дивіться нижче:
Звичайно, вони також можуть бути в іншому "масштабі", як видно з цієї родини:
І, нарешті, ось кілька «реалістичних» сценаріїв того, що я можу насправді отримати, де лунатиме шум, рядки можуть «згасати», коли ви йдете до дна, і, звичайно, на зображенні буде багато хибних ліній, артефактів тощо.
І звичайно, як великий фінал, існує чітка можливість цього "екстремального" сценарію:
Тож ще раз я хотів би попросити декілька вказівок щодо того, які методи комп’ютерно-машинного зору я повинен використовувати тут, щоб найкраще визначити появу моєї картини, де мені потрібно змінити масштаб і інваріантно, як ви бачите, і також мати можливість отримати гідні результати для реалістичних сценаріїв. (Хороша новина полягає в тому, що мені НЕ потрібно, щоб він був ротаційно інваріантним). Єдина ідея, яку мені вдалося придумати поки що, - це 2-D кореляція.
Додам, що насправді я НЕ маю кольорових зображень - я просто отримаю мартикс чисел, тож я гадаю, що ми говоримо про "відтінки сірого".
Спасибі заздалегідь!
PS Для чого варто, я, мабуть, буду використовувати відкритий C V.
ЗРІД №1:
На основі коментарів я додав деталі, які ви тут просили:
Для характеристик, що визначають дані, можна припустити наступне:
Горизонтальна довжина кожного пінга може змінюватися, але я знаю верхню і нижню межі його. ТАК для будь-чого в межах цієї межі, НІ для нічого зовнішнього. (Наприклад, я знаю, що довжина пінгів може бути від 1 до 3 секунд, наприклад).
Усі такси повинні бути "видимими" для ТАК, проте останній рядок може бути відсутнім, і все ж хочеться сказати "ТАК". Інакше НІ.
Вертикальна довжина ("товщина") кожного пінгу може змінюватися, але, знову ж таки, також знати верхню та нижню межі. (Подібно до того, що ви бачите на цих зображеннях). ТАК для чого-небудь у межах цієї межі. НІ для чогось зовні.
Висота між кожним пінг завжди повинна бути однаковою для ТАК. Якщо їх немає, то НІ. (Наприклад, ви можете бачити, як усі пінг однакової висоти відносно один одного, ~ 110 по вертикальній осі). Так що 110 +/- 5 може бути ТАК, все інше повинно бути НІ.
Я думаю, що це з цього приводу - але дайте мені знати, що ще я можу додати ... (Крім того, все, що показано тут, має реєструватися як ТАК, btw).
detect this pattern shown here
? Ви просто зацікавлені в виділенні червоної / жовтої лінії або ви дійсно хочете вираження, яке обчислює зв’язок між такими лініями. Лише знаходження ліній може зажадати лише певного порогу чи сегментації. Чого ти насправді хочеш?