Сезонне коригування щомісячного зростання з базовою щотижневою сезонністю


9

Як побічне захоплення я досліджував часові ряди прогнозування (зокрема, використовуючи R).

За моїми даними, я маю кількість відвідувань на день, за кожен день назад майже 4 роки. У цих даних є кілька чітких закономірностей:

  1. Понеділок-Пт має багато відвідувань (найвище в пн / вт), але різко менше на сб-нд.
  2. Певна пора року падає (тобто набагато менше відвідувань навколо свят у США, літо показує менший ріст)
  3. Значне зростання з року в рік

Було б непогано мати можливість прогнозувати майбутній рік за допомогою цих даних, а також використовувати його, щоб мати сезонний приріст за місяцем. Головне, що відкидає мене щомісячним переглядом:

  • Окремі місяці матимуть більше Пн / Вт, ніж інші місяці (і це також не відповідає рокам). Тому місяць, що трапляється на більшу кількість робочих днів, потрібно відповідно відрегулювати.

Дослідження тижнів також здається важким, оскільки системи нумерації тижнів змінюються від 52-53 в залежності від року, і, здається, tsце не справляється.

Я замислююся над тим, щоб прийняти середнє значення для будних днів місяця, але отримана одиниця трохи дивна (Зростання серп. Відвідувань у будні дні), і це могло б видалити дані, що є дійсним.

Я думаю, що подібні дані будуть поширеними у часових рядах (скажімо, наприклад, використання електричної енергії в офісній будівлі може бути чимось подібним), у когось є поради, як їх моделювати, зокрема, в R?

Дані, з якими я працюю, доволі прямо, вони починаються так:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

і продовжує подібне до сьогодні, із загальною тенденцією зростання, деякими занепадами у вихідні тижні в США, а зростання в цілому сповільнюється протягом літа.


Іншим цікавим аспектом даних є те, що трапляються раптові події, які переривають загальну тенденцію зростання на ~ ~ пару місяців. Хоча зараз, де я перебуваю на етапі спроб правильно встановити сезонність, я ігнорую цей аспект.
Кайл Брандт

Також виправте мене, якщо я неправильно використовую "сезонність". В даний час я думаю про це патерну в межах одиниці часу, яку я кажу. Тож "Щотижнева сезонність" для мене означає "Шаблон, який повторюється щотижня".
Кайл Брандт

Хм, звучить знайомо (-;

Дивіться відповіді на stats.stackexchange.com/questions/14742/… . Це може бути відправною точкою.
Пітер Елліс

Можливо, в основі цього лежить поєднання тиждень + рік? Здається, ts(і навіть msts) не відповідає періоду вибірки тижня з "природним" періодом року (також календарі насправді не здогадуються). Або я просто не розумію, як змусити цю роботу ...
Кайл Брандт,

Відповіді:


5

Я моделюю таким чином дані постійно. Вам потрібно зареєструватися

  • день тижня
  • ефекти відпустки (ефекти свинцю, сучасність та відставання)
  • спеціальні дні місяця
  • можливо, п’ятниця перед святом або понеділок після свята
  • щотижневі ефекти
  • щомісячні ефекти
  • Структура ARIMA для надання білим шумам помилок;
  • та ін. .

Статистичний підхід називається моделюванням функції передачі з виявленням інтервенції. Якщо ви хочете поділитися своїми даними або приватно через dave@autobox.com, або бажано через SE, я був би більш ніж радий показати вам специфіку остаточної моделі та надалі змогу зробити це самостійно або принаймні допомогти вам та інші, щоб зрозуміти, що потрібно зробити і що можна зробити. У будь-якому випадку ви виходите розумніші, не витрачаючи жодних скарбів, будь то монета чи час. Ви можете прочитати деякі мої відповіді на запитання часових рядів, щоб дізнатися більше.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.