Принаймні, наскільки мені відомо, для цього не існує «загального підходу». Крім того, ви намагаєтесь все-таки мінімізувати метрику відстані. Наприклад, у дідусі з паперів DTW Sakoe & Chiba (1978) використовуютьяк вимірювання різниці між двома характеристичними векторами.| |аi-бi| |
Як ви правильно визначили, вам потрібно мати однакову кількість балів (як правило), щоб це вийшло з поля. Я б запропонував використовувати більш низький () більш плавний / інтерполятор над кривими, щоб зробити їх спочатку однакового розміру. Це досить стандартний матеріал для "кривої статистики". Ви можете побачити приклад заявки в Chiou et al. (2003) ; автори не хвилюються щодо DTW як такої у цій роботі, але це хороший приклад, як поводитися з показаннями неоднакового розміру.
Крім того, як ви говорите, "амплітуда" є проблемою. Це трохи відкритіше, якщо чесно. Ви можете спробувати підхід «Площа під кривою», як той, запропонований Чжаном та Мюллером (2011), щоб подбати про це, але справді для цілей викривлення навіть нормалізації норми (тобто замінити на міг би зробити так, як у цій роботі Танга та Мюллера (2009) . Я б дотримувався другого, але в будь-якому випадку, як ви також помітили, нормалізація зразків - це необхідність.f( х )f( х )с уpу| f( х ) |
Залежно від характеру ваших даних ви можете знайти більше літератури, яка стосується додатків. Я особисто вважаю підхід мінімізації відносно цільової функції парної деформації найбільш інтуїтивним із усіх. Тож цільовою функцією мінімізації є:
, де все це , не дивлячись на це uncanniness насправді досить простий: ви намагаєтеся знайти , щоб знайти викривлення функцію , що зводить до мінімуму очікуваної суми невідповідності викривленого кривого запиту до опорна крива (термінгСλ(Yi,Yк, г) = Е{∫Т(Yi( g( t ) ) -Yк( t ))2+ λ ( g( t ) - t)2гт |Yi,Yк}гYi( g( t ) )Yк( t )Yi( g( t ) ) -Yк( t )) за умови певної нормалізації спотворення, яке ви накладаєте тим самим викривленням (термін ). Це реалізація пакету MATLAB PACE . Я знаю, що існує R пакет FDA від JO Ramsay et al. це може бути корисним, але я особисто не використовував це (трохи дратує стандартне посилання на методи цього пакету, в багатьох випадках відмінна книга Рамзі та Сільвермана, Функціональний аналіз даних (2006), 2-е видання , і вам потрібно прокрутити Книга на 400 сторінок, щоб отримати те, що ви шукаєте; принаймні, добре все-таки прочитати)г( t ) - t
Проблема, яку ви описуєте в статистичній літературі, широко відома як " реєстрація кривих " (наприклад, див. Гассер та Кнайп (1995) для раннього розгляду питання) і підпадає під загальну парасольку функціональних методів аналізу даних .
(У випадках, коли я міг знайти оригінальний папір, доступний в режимі он-лайн, посилання направляє туди; в іншому випадку посилання спрямовується на загальну цифрову бібліотеку. Практично всі згадані папери можна знайти безкоштовно для складання версій. Я видалив свій оригінальний коментар як є замінено цією публікацією.)