Як побічне захоплення я досліджував часові ряди прогнозування (зокрема, використовуючи R).
За моїми даними, я маю кількість відвідувань на день, за кожен день назад майже 4 роки. У цих даних є кілька чітких закономірностей:
- Понеділок-Пт має багато відвідувань (найвище в пн / вт), але різко менше на сб-нд.
- Певна пора року падає (тобто набагато менше відвідувань навколо свят у США, літо показує менший ріст)
- Значне зростання з року в рік
Було б непогано мати можливість прогнозувати майбутній рік за допомогою цих даних, а також використовувати його, щоб мати сезонний приріст за місяцем. Головне, що відкидає мене щомісячним переглядом:
- Окремі місяці матимуть більше Пн / Вт, ніж інші місяці (і це також не відповідає рокам). Тому місяць, що трапляється на більшу кількість робочих днів, потрібно відповідно відрегулювати.
Дослідження тижнів також здається важким, оскільки системи нумерації тижнів змінюються від 52-53 в залежності від року, і, здається, ts
це не справляється.
Я замислююся над тим, щоб прийняти середнє значення для будних днів місяця, але отримана одиниця трохи дивна (Зростання серп. Відвідувань у будні дні), і це могло б видалити дані, що є дійсним.
Я думаю, що подібні дані будуть поширеними у часових рядах (скажімо, наприклад, використання електричної енергії в офісній будівлі може бути чимось подібним), у когось є поради, як їх моделювати, зокрема, в R?
Дані, з якими я працюю, доволі прямо, вони починаються так:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
і продовжує подібне до сьогодні, із загальною тенденцією зростання, деякими занепадами у вихідні тижні в США, а зростання в цілому сповільнюється протягом літа.
ts
(і навіть msts
) не відповідає періоду вибірки тижня з "природним" періодом року (також календарі насправді не здогадуються). Або я просто не розумію, як змусити цю роботу ...