@Irishstat в значній мірі висвітлював те, що я збирався сказати, але я відповів би своїм власним досвідом моделювання цих даних регресією часових рядів та регресією OLS.
Якщо це щоденні дані, я б зробив наступне:
Створіть фіктивну змінну для різної сезонності:
- Щоб зафіксувати сезонність сезону, створіть 6 змінних змінних.
- Щоб зафіксувати сезонність сезону, створіть 30 змінних фіктивних змін
- Щоб зафіксувати місяць року, створіть 11 фіктивних змінних.
Створіть фіктивну змінну для змінних тенденцій:
Якщо часовий ряд демонструє лінійну тенденцію, то додайте змінну часової тенденції.
Якщо часовий ряд демонструє нелінійну тенденцію, додайте нелінійну змінну тенденції часу, наприклад квадратичну / кубічну / журнал
Додати незалежні змінні змінні
Це дані часових рядів, тому слід бути обережним щодо ефектів відведення та відставання незалежних варіантів. Наприклад, у своєму прикладі ви згадуєте рекламний прапор ціни на ціни, вони можуть не мати негайного впливу на вашу відповідь, тобто можуть виникнути відставання та затухаючий / постійний ефект. Так, наприклад, якщо запустити акцію сьогодні, ви можете мати збільшення продажів сьогодні, але ефект від просування зменшується через кілька днів. Немає простого способу моделювати це за допомогою множинної регресії, ви хочете використовувати моделювання функції передачі, яке є парсимоноєм і може обробляти будь-який тип ефектів відведення та відставання. Дивіться цей приклад, який я розміщував раніше, де відбувається втручання (у вашому випадку цінова точка) і спостерігається різке зростання з подальшим ефектом затухання. Сказав, що якщо єапріорні знання про ефект відведення та відставання, створіть додаткові змінні у вашому випадку фіктивних змінних до та після зміни ціни та (так / ні) зміни акції.
Вам також потрібно буде додати змінні індикатори святкових свят, наприклад, як Ірландський штат зазначив, що ви хочете додати Великдень / День подяки (в США), які рухаються у святкові дні. Відпустки, які є фіксованими датами, будуть автоматично доглянуті, якщо ви використовуєте схему кодекерів, що використовується для фіксації сезонності.
Крім того, вам потрібно буде визначити залишків, таких як добавка / імпульс (одноразова подія) або зсув рівня (постійний зсув) і додати їх як регресорів. Ідентифікувати людей, що переживають люди, за допомогою множинної регресії даних часових рядів майже неможливо; вам знадобляться методи виявлення зовнішніх часових рядів, такі як процедура Цей або процедура Чен і Лю, яка вбудована в програмне забезпечення, таке як AUTOBOX, SPSS, SAS або tsoutlier
пакет у Р.
Потенційні проблеми:
Далі наведені проблеми, з якими ви зіткнетесь, якщо змоделювати дані часових рядів за допомогою множинної регресії OLS.
- Помилки можуть бути автоматично пов’язані. Дивіться цей приємний веб-сайт і цей веб-сайт, що пояснює цю проблему. Одним із способів уникнути цього є використання узагальнених найменших квадратів (GLS) або підходу ARIMAX проти множинної регресії OLS, де ви можете скорегувати автоматичну кореляцію.
- 6 + 30 + 11 = 47
- Використовуючи фіктивні змінні, ви припускаєте, що ваша сезонність є детермінованою, тобто вона не змінюється з часом. Оскільки у вас є лише 3 роки даних, я б про це не хвилювався, але все ж варто скласти сюжет і подивитися, чи не зміниться сезонність.
І є ще багато недоліків використання багаторазової регресії. Якщо передбачення важливіше для вас, я б протримав принаймні 6 місяців даних і перевірив здатність прогнозування вашої багаторазової регресії. Якщо ваша основна мета полягає в тому, щоб пояснити співвідношення між незалежними змінними, я би з обережністю використовував багаторазову регресію, і замість цього я використовував би підхід часового ряду, такий як ARIMAX / GLS.
Якщо вас зацікавило, ви можете посилатися на відмінний текст Панкраца для передачі функції та моделювання динамічної регресії. Для загального прогнозування часових рядів зверніться до Makridakis та ін . Крім того, хорошим довідковим текстом буде Diebold для регресії та прогнозування на основі часових рядів.