Ще одне питання щодо часових рядів у мене.
У мене є набір даних, який щоденно реєструє випадки насильства в психіатричній лікарні протягом трьох років. За допомогою попереднього запитання я поспілкувався з цим і зараз трохи щасливіший.
Зараз у мене є те, що щоденні серії дуже галасливі. Він коливається дико, вгору і вниз, від 0 часом до 20. Використовуючи графіки лососу та пакет прогнозу (який я настійно рекомендую для початківців, як я), я отримую абсолютно рівну лінію з великими інтервалами довіри від прогнозу.
Однак агрегація даних щотижня або щомісяця має набагато більше сенсу. Вони змітаються з початку серії, а потім знову збільшуються в середині. Лосс-графік та пакет прогнозування створюють щось більш значуще.
Це відчуває трохи схоже на обман. Я просто віддаю перевагу зведеним версіям, тому що вони виглядають приємно, не маючи реальної дійсності до цього?
Або було б краще обчислити ковзну середню і використовувати це як основу? Я боюся, що я не розумію теорії, що стоїть за усім цим досить добре, щоб бути впевненим у тому, що є прийнятним