Я намагаюся дослідити і з’ясувати, як найкраще напасти на цю проблему. Це стримує обробку музики, обробку зображень та обробку сигналів, і тому існує безліч способів переглянути це. Мені хотілося поцікавитись найкращими способами наближення до нього, оскільки те, що може здатися складним у чистому домі sig-proc, може бути простим (і вже вирішеним) людьми, які займаються обробкою зображень чи музики. У будь-якому випадку проблема полягає в наступному:
Якщо ви простите моєму малюнку проблеми, ми можемо побачити наступне:
З наведеного малюнка у мене є 3 різних "типи" сигналів. Перший - це імпульс, який на зразок "крокує" по частоті від до , а потім повторюється. Він має конкретну тривалість імпульсу та певний час повторення імпульсу.
Другий існує лише у , але має меншу довжину імпульсу та більш швидку частоту повторення імпульсу.
Нарешті, третій - це просто тон у .
Проблема полягає в тому, яким чином я підходжу до цієї проблеми, щоб я міг написати класифікатор, який може розрізняти сигнал-1, сигнал-2 та сигнал-3. Тобто, якщо ви подаєте йому один із сигналів, він повинен мати можливість сказати вам, що цей сигнал є таким і таким. Який найкращий класифікатор дав би мені діагональну матрицю плутанини?
Деякий додатковий контекст і те, що я до цього часу думав:
Як я вже казав, це обшиває ряд полів. Мені хотілося поцікавитись, які методології вже можуть існувати, перш ніж сісти і почати війну з цим. Я не хочу ненавмисно переосмислити колесо. Ось деякі думки, які я переглядав з різних точок зору.
Точка опрацювання сигналу: одне, на що я звернув увагу, - це робити цепстральний аналіз , а потім, можливо, використовуючи пропускну здатність Габора прокладки черепашки для розрізнення сигналу-3 від інших 2, а потім вимірювати найвищий пік черевної труби в дискримінаційному сигналі- 1 від сигналу-2. Це моє поточне робоче рішення для обробки сигналів.
Точка обробки зображень: Тут я думаю, оскільки я можу насправді створювати зображення відносно спектрограм, можливо, я можу використовувати щось із цього поля? Я не глибоко знайомий з цією частиною, але що робити з виявленням 'лінії' за допомогою Hough Transform , а потім якимось чином 'рахувати' рядки (що, якщо вони не є лініями і краплями?) Та йти звідти? Звичайно, в будь-який момент часу, коли я беру спектрограму, весь імпульс, який ви бачите, може бути зміщений уздовж осі часу, тож це буде мати значення? Не впевнений...
Позиція музичної обробки: Підмножина обробки сигналів напевно, але мені здається, що сигнал-1 має певну, можливо, повторювану (музичну?) Якість, яку люди в музичній програмі бачать весь час і вже вирішили в можливо, дискримінаційні інструменти? Не впевнений, але думка в мене виникла. Можливо, ця точка зору - найкращий спосіб поглянути на це, взявши шматок часової області та дражнивши ці ступінчасті ставки? Знову ж таки, це не моє поле, але я дуже підозрюю, що це щось, що було бачено раніше ... чи можемо ми розглядати всі 3 сигнали як різні типи музичних інструментів?
Я також повинен додати, що у мене є пристойний обсяг даних про навчання, тому, можливо, використання деяких з цих методів може просто дозволити мені зробити деякий видобуток функції, з яким я потім можу використовувати K-Найближчий сусід , але це лише думка.
У будь-якому випадку я зараз стою, будь-яка допомога вдячна.
Дякую!
РЕДАКТИ, засновані на коментарях:
Так, , , , - всі заздалегідь відомі. (Дещо дисперсії, але дуже мало. Наприклад, скажемо, що ми знаємо, що = 400 Гц, але він може зайти в 401,32 Хц. Однак відстань до велика, тому може бути 500 Гц порівняно.) Сигнал-1 ЗАВЖДИ наступить на ці 4 відомі частоти. Сигнал-2 ВЖЕ буде мати 1 частоту.f 2 f 3 f 4 f 1 f 2 f 2
Швидкість повторення імпульсів і довжина імпульсу всіх трьох класів сигналів також всі відомі заздалегідь. (Знову деяка дисперсія, але дуже мало). Деякі застереження, хоча частота повторення імпульсу та довжина імпульсів сигналів 1 і 2 завжди відомі, але вони є діапазоном. На щастя, ці діапазони взагалі не перетинаються.
Вхід - це безперервний часовий ряд, що надходить у режимі реального часу, але ми можемо припустити, що сигнали 1, 2 і 3 взаємно виключають, при цьому лише один з них існує в будь-який момент часу. У нас також є велика гнучкість щодо того, скільки часу ви забираєте його на обробку в будь-який момент часу.
Дані можуть бути галасливими, так, і в діапазонах, що не є у наших відомих , , , можуть бути хибні тони тощо . Це цілком можливо. Ми можемо припустити, що середньовисокий показник SNR є лише для того, щоб "розпочати" проблему.f 2 f 3 f 4