STL у часових рядах із відсутніми значеннями для виявлення аномалії


12

Я намагаюсь виявити аномальні значення у часовій серії кліматичних даних з деякими відсутніми спостереженнями. Шукаючи в Інтернеті, я знайшов багато доступних підходів. З них, розкладання stl здається привабливим, у сенсі вилучення тренду та сезонних компонентів та вивчення решти. Читання STL: Процедура декомпозиції сезонного тренду, що базується на Лоссі , stlвидається гнучким у визначенні параметрів призначення присвоєння змінності, що не впливає на інші люди, і можливо застосувати, незважаючи на відсутні значення. Однак, намагаючись застосувати його , зіткнувшись Rіз чотирма роками спостережень та визначенням усіх параметрів відповідно до http://stat.ethz.ch/R-manual/R-patched/library/stats/html/stl.html , я стикаюся помилка:

"time series contains internal NAs"(коли na.action=na.omit) і
"series is not periodic or has less than two periods"(коли na.action=na.exclude).

Я двічі перевірив, чи правильно визначена частота. Я бачив відповідні питання в блогах, але не знайшов жодної пропозиції, яка могла б вирішити це. Чи не можливо застосувати stlв серії з пропущеними значеннями? Я дуже неохоче інтерполюю їх, оскільки не хочу вносити (і, отже, виявляти ...) артефакти. З цієї ж причини я не знаю, наскільки доцільно було б замість цього використовувати підходи ARIMA (і якщо пропущені значення все-таки будуть проблемою).

Будь ласка, поділіться, якщо ви знаєте спосіб застосування stlв серії з пропущеними значеннями, або якщо ви вважаєте, що мій вибір методологічно не є обгрунтованим, або якщо ви маєте кращі пропозиції. Я зовсім новий в цій галузі і переповнений купою (здавалося б ...) відповідної інформації.


У мене така ж проблема. Метод STL повинен мати можливість просто заповнити пропущені значення через LOESS, але ця R-реалізація, схоже, не робить цього.
jf328

Відповіді:


5

Моделі ARIMA легко включають фіктивні змінні для вирішення відсутніх значень. Вони називаються індикаторами пульсу. Методика проста та задокументована у http://www.unc.edu/~jbhill/tsay.pdf . Взагалі метод витягує з поточної залишкової інформації про імпульси, зсув рівня, сезонні імпульси та місцеві тенденції часу.


дякую за пропозицію та дуже цікаву статтю!
effie


0

Ви також можете перевірити пакет Hafenstlplus . Деталі містяться в його тезі.

Ви можете встановити його з CRAN за допомогою

install.packages("stlplus")

або безпосередньо з github с

devtools::install_github("hafen/stlplus").
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.