Мені потрібно реалізувати виявлення аномалії на кількох наборах даних часових рядів. Я ніколи цього не робив і сподівався на поради. Мені дуже зручно з python, тому я вважаю за краще, щоб рішення було втілено в ньому (більшість мого коду - це python для інших частин моєї роботи).
Опис даних: дані щомісячних часових рядів, які тільки почали збиратися протягом останніх 2 років або близько того (тобто лише 24-36 періодів часу). По суті, існує кілька показників, які щомісячно контролюються для декількох клієнтів.
time_period client metric score
01-2013 client1 metric1 100
02-2013 client1 metric1 119
01-2013 client2 metric1 50
02-2013 client2 metric2 500
...
Ось що я думаю: витягніть дані у рамку даних (панди), а потім обчисліть середню 6-місячну середню для кожного пари клієнта / показника. Якщо значення поточного періоду часу перевищує деякий поріг на основі 6-місячного серп., Тоді підніміть прапор. Проблема здається досить простою. Я просто хочу переконатися, що я прийняв твердий підхід.
Будемо дуже вдячні за будь-яку пораду, щоб трохи одержати цю ідею. Я знаю, що питання трохи абстрактне, і я вибачаюся за це.