Я часто будую модель (класифікацію чи регресію), де у мене є деякі змінні прогнози, що є послідовностями, і я намагаюся знайти рекомендації щодо техніки для їх узагальнення найкращим чином для включення в якості предикторів до моделі.
Як конкретний приклад, скажімо, будується модель, яка передбачає, чи клієнт покине компанію протягом наступних 90 днів (у будь-який час між t і t + 90; таким чином, бінарний результат). Одним із доступних прогнозів є рівень фінансового балансу клієнтів за періоди t_0 до t-1. Можливо, це відображає щомісячні спостереження за попередні 12 місяців (тобто 12 вимірювань).
Я шукаю способи побудови функцій з цієї серії. Я використовую описові описи кожної серії клієнтів, такі як середній, високий, низький, строковий розробник, підходить до регресії OLS, щоб отримати тенденцію. Чи є їхні інші методи обчислення ознак? Інші заходи змін або мінливості?
ДОДАТИ:
Як було сказано у відповіді нижче, я також розглядав (але забув додати тут), використовуючи динамічне викривлення часу (DTW), а потім ієрархічну кластеризацію на отриманій матриці відстані - створюючи деяку кількість кластерів, а потім використовуючи членство кластера як функцію. Оцінка даних тестів, ймовірно, повинна слідувати процесу, коли DTW робився в нових випадках і центроїдах кластера - відповідності нової серії даних до їх найближчих центроїдів ...