Захоплення сезонності за допомогою множинної регресії для щоденних даних


13

У мене є щоденні дані про продажі товару, що є дуже сезонним. Я хочу зафіксувати сезонність у регресійній моделі. Я читав, що якщо у вас є дані щокварталу чи щомісяця, у такому випадку ви можете створити 3 та 11 фіктивних змінних відповідно - але чи можу я мати справу з щоденними даними?

У мене є три роки щоденних даних. Незалежними змінними є ціна, рекламний прапор (так / ні) та температура. Залежна змінна - це продаж цього продукту. Я не шукаю модель часових рядів, оскільки використовую модель множинної регресії.


Скільки у вас даних? Скільки років коштує? Чи є у вас дані про щось на зразок температури? Як виглядає решта вашої моделі? Які ваші DV та IV?
Пітер Флом - Відновіть Моніку

Окрім того, що запитав Пітер Флом, чи моделюєте ви свої дані як одномірний часовий ряд або багатоваріантний часовий ряд? Якщо вона багатоваріантна, чи є у вас інші змінні? Чи проявляє ця змінна сезонна поведінка? якщо так, додавання фіктивної змінної було б непотрібним. Чи можете ви надати цю додаткову інформацію?
синоптик

Я відредагував своє запитання. Чи можете ви надати будь-яке рішення. Спасибі
Аруші


Я повністю погоджуюся з @IrishStat, ми не будемо припускати, що ігнорувати моделі часових рядів, досить гарна модель, яка фіксує багаторазову сезонність. Я б запропонував вам перевірити експоненціальну модель згладжування простору стану, яка має можливість обробляти декілька сезонності, Тенденція, одночасно.визначає виключно R..Ви можете скористатися пакетом прогнозу ().
Karthi V

Відповіді:


10

@Irishstat в значній мірі висвітлював те, що я збирався сказати, але я відповів би своїм власним досвідом моделювання цих даних регресією часових рядів та регресією OLS.

Якщо це щоденні дані, я б зробив наступне:

Створіть фіктивну змінну для різної сезонності:

  • Щоб зафіксувати сезонність сезону, створіть 6 змінних змінних.
  • Щоб зафіксувати сезонність сезону, створіть 30 змінних фіктивних змін
  • Щоб зафіксувати місяць року, створіть 11 фіктивних змінних.

Створіть фіктивну змінну для змінних тенденцій:

  • Якщо часовий ряд демонструє лінійну тенденцію, то додайте змінну часової тенденції.

  • Якщо часовий ряд демонструє нелінійну тенденцію, додайте нелінійну змінну тенденції часу, наприклад квадратичну / кубічну / журнал

Додати незалежні змінні змінні

  • Це дані часових рядів, тому слід бути обережним щодо ефектів відведення та відставання незалежних варіантів. Наприклад, у своєму прикладі ви згадуєте рекламний прапор ціни на ціни, вони можуть не мати негайного впливу на вашу відповідь, тобто можуть виникнути відставання та затухаючий / постійний ефект. Так, наприклад, якщо запустити акцію сьогодні, ви можете мати збільшення продажів сьогодні, але ефект від просування зменшується через кілька днів. Немає простого способу моделювати це за допомогою множинної регресії, ви хочете використовувати моделювання функції передачі, яке є парсимоноєм і може обробляти будь-який тип ефектів відведення та відставання. Дивіться цей приклад, який я розміщував раніше, де відбувається втручання (у вашому випадку цінова точка) і спостерігається різке зростання з подальшим ефектом затухання. Сказав, що якщо єапріорні знання про ефект відведення та відставання, створіть додаткові змінні у вашому випадку фіктивних змінних до та після зміни ціни та (так / ні) зміни акції.

  • Вам також потрібно буде додати змінні індикатори святкових свят, наприклад, як Ірландський штат зазначив, що ви хочете додати Великдень / День подяки (в США), які рухаються у святкові дні. Відпустки, які є фіксованими датами, будуть автоматично доглянуті, якщо ви використовуєте схему кодекерів, що використовується для фіксації сезонності.

  • Крім того, вам потрібно буде визначити залишків, таких як добавка / імпульс (одноразова подія) або зсув рівня (постійний зсув) і додати їх як регресорів. Ідентифікувати людей, що переживають люди, за допомогою множинної регресії даних часових рядів майже неможливо; вам знадобляться методи виявлення зовнішніх часових рядів, такі як процедура Цей або процедура Чен і Лю, яка вбудована в програмне забезпечення, таке як AUTOBOX, SPSS, SAS або tsoutlierпакет у Р.

Потенційні проблеми:

Далі наведені проблеми, з якими ви зіткнетесь, якщо змоделювати дані часових рядів за допомогою множинної регресії OLS.

  • Помилки можуть бути автоматично пов’язані. Дивіться цей приємний веб-сайт і цей веб-сайт, що пояснює цю проблему. Одним із способів уникнути цього є використання узагальнених найменших квадратів (GLS) або підходу ARIMAX проти множинної регресії OLS, де ви можете скорегувати автоматичну кореляцію.
  • 6+30+11=47
  • Використовуючи фіктивні змінні, ви припускаєте, що ваша сезонність є детермінованою, тобто вона не змінюється з часом. Оскільки у вас є лише 3 роки даних, я б про це не хвилювався, але все ж варто скласти сюжет і подивитися, чи не зміниться сезонність.

І є ще багато недоліків використання багаторазової регресії. Якщо передбачення важливіше для вас, я б протримав принаймні 6 місяців даних і перевірив здатність прогнозування вашої багаторазової регресії. Якщо ваша основна мета полягає в тому, щоб пояснити співвідношення між незалежними змінними, я би з обережністю використовував багаторазову регресію, і замість цього я використовував би підхід часового ряду, такий як ARIMAX / GLS.

Якщо вас зацікавило, ви можете посилатися на відмінний текст Панкраца для передачі функції та моделювання динамічної регресії. Для загального прогнозування часових рядів зверніться до Makridakis та ін . Крім того, хорошим довідковим текстом буде Diebold для регресії та прогнозування на основі часових рядів.


Дуже приємний підсумок, Але я хотів би додати, що ви проігнорували конкретні ефекти тижня місяця та конкретні дні місяця, а також можливі ефекти у вихідні дні, які я вважаю дуже важливими. Крім того, наслідки перед подією та після події не слід ігнорувати. Розгляньте діяльність навколо Великодня та інших великих свят / подій. Часто існує індивідуальна схема відповідей, яка вимагає включення специфікації LEAD. Слід також зазначити, що параметри можуть і часто змінюватися з часом, і потрібно перевірити припущення про сталість параметрів.
IrishStat

Дякуємо @Irishstat Ти правий. Я забув бій, які рухаються відпустки та їх наслідки та відставання.
синоптик

2

Вам потрібна модель, яка буде включати щоденні ефекти, щотижневі ефекти, щомісячні ефекти, ефекти тижня місяця, наслідки дня місяця, ефекти відпустки та відставання відпусток, не визначені, але емпірично визначені зрушення рівня / кроку, місцеві тенденції часу, зміни сезонних імпульсів та імпульсів, включаючи структуру ARIMA та, можливо, стосуючись змін параметрів та відхилення помилок у часі. Це називається функцією передачі, і її можна легко перезапустити (АЛЕ НЕ ПАРШИМОНІЗНО) у вигляді множинної лінійної регресії.

У конкретних добових показниках брали б 6 прогнозів. Загалом треба ретельно оркеструвати (визначити), які саме прогнози потрібні. Якщо у вас багато часу на руках, ви можете експериментувати з деякими згаданими нами структурами. Крім того, вам може знадобитися розширене програмне забезпечення / консультація, щоб допомогти вам вирішити свою проблему протягом життя.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.