Я використовую моделі R (3.1.1) та ARIMA для прогнозування. Я хотів би знати, яким повинен бути параметр "частота", який призначається у ts()
функції , якщо я використовую дані часових рядів, які є:
- розділяється на хвилини і поширюється на 180 днів (1440 хвилин / день)
- розділена на секунди і поширюється на 180 днів (86 400 секунд / день).
Якщо правильно згадати визначення, "частота" в ц в R - це кількість спостережень за "сезон".
Частина питання 1:
Який "сезон" у моєму випадку?
Якщо сезон "денний", то "частота" хвилин = 1440 і 86 400 на секунди?
Частина питання 2:
Чи може "частота" також залежати від того, що я намагаюся досягти / прогнозувати? наприклад, у моєму випадку я хотів би мати дуже короткостроковий прогноз. Кожен крок попереду на 10 хвилин щоразу. Чи можна було б тоді розглядати сезон як годину замість дня? У такому випадку частота = 60 хвилин, частота = 3600 секунд?
Я спробував, наприклад, використовувати частоту = 60 для хвилинних даних і отримав кращі результати порівняно з частотою = 1440 (використовується fourier
див. Посилання Hyndman нижче)
http://robjhyndman.com/hyndsight/forecasting-weekly-data/
(Порівняння проводилося за допомогою MAPE для вимірювання точності прогнозу)
У випадку, якщо результати повністю довільні, і частоту змінити неможливо. Якою б насправді була інтерпретація використання freq = 60 у моїх даних?
Я також думаю, що варто згадати, що мої дані містять сезонність щогодини та кожні дві години (дотримуючись необроблених даних та функції автокореляції)