Я намагаюсь виявити аномальні значення у часовій серії кліматичних даних з деякими відсутніми спостереженнями. Шукаючи в Інтернеті, я знайшов багато доступних підходів. З них, розкладання stl здається привабливим, у сенсі вилучення тренду та сезонних компонентів та вивчення решти. Читання STL: Процедура декомпозиції сезонного тренду, що базується на Лоссі , stl
видається гнучким у визначенні параметрів призначення присвоєння змінності, що не впливає на інші люди, і можливо застосувати, незважаючи на відсутні значення. Однак, намагаючись застосувати його , зіткнувшись R
із чотирма роками спостережень та визначенням усіх параметрів відповідно до http://stat.ethz.ch/R-manual/R-patched/library/stats/html/stl.html , я стикаюся помилка:
"time series contains internal NAs"
(коли na.action=na.omit
) і
"series is not periodic or has less than two periods"
(коли na.action=na.exclude
).
Я двічі перевірив, чи правильно визначена частота. Я бачив відповідні питання в блогах, але не знайшов жодної пропозиції, яка могла б вирішити це. Чи не можливо застосувати stl
в серії з пропущеними значеннями? Я дуже неохоче інтерполюю їх, оскільки не хочу вносити (і, отже, виявляти ...) артефакти. З цієї ж причини я не знаю, наскільки доцільно було б замість цього використовувати підходи ARIMA (і якщо пропущені значення все-таки будуть проблемою).
Будь ласка, поділіться, якщо ви знаєте спосіб застосування stl
в серії з пропущеними значеннями, або якщо ви вважаєте, що мій вибір методологічно не є обгрунтованим, або якщо ви маєте кращі пропозиції. Я зовсім новий в цій галузі і переповнений купою (здавалося б ...) відповідної інформації.