Мене вражає forecast
пакет R , а також, наприклад, zoo
пакет для нерегулярних часових рядів та інтерполяції відсутніх значень.
Мій додаток знаходиться в області прогнозування трафіку кол-центру, тому дані про вихідні (майже) завжди відсутні, що може бути чудово оброблено zoo
. Також деякі дискретні точки можуть бути відсутніми, я просто використовую R NA
для цього.
Справа в тому: все добре магія прогнозного пакета, наприклад eta()
, і auto.arima()
т.д., здається, чекають прості ts
об'єкти, тобто еквідистантно часових рядів , що не містять жодних - або відсутніх даних. Я думаю, що реальні додатки для часових рядів, що мають єдиний характер, безумовно, існують, але, на мій погляд, дуже обмежені.
Проблему декількох дискретних NA
значень можна легко вирішити, використовуючи будь-яку із запропонованих функцій інтерполяції в zoo
, а також за допомогою forecast::interp
. Після цього я запускаю прогноз.
Мої запитання:
- Хтось пропонує краще рішення?
(моє головне запитання) Принаймні у моєму додатку, прогнозуванні трафіку в центрі обслуговування (і наскільки я можу уявити більшість інших проблемних доменів), часові ряди не зрівняються. Принаймні, у нас є повторювані схеми "робочих днів" чи щось таке. Який найкращий спосіб впоратися з цим і все-таки використовувати всі круті чари пакету прогнозів?
Чи варто просто "стиснути" часовий ряд, щоб заповнити вихідні дні, зробити прогноз, а потім знову "надути" дані, щоб знову вставити значення NA у вихідні дні? (Я гадаю, гадаю?)
Чи планується зробити пакет прогнозу повністю сумісним з нерегулярними пакетами часових рядів, як-от зоопарк чи його? Якщо так, коли і якщо ні, то чому б ні?
Я зовсім новачок у прогнозуванні (і статистиці взагалі), тому я можу не помітити щось важливе.
auto.arima
може обробляти відсутні значення.