Як додати періодичну складову до лінійної регресійної моделі?


17

У мене є деякі дані накопичувальної частоти. Рядок виглядає так, що він надзвичайно добре відповідає даним, але в циклі є циклічне / періодичне хитання. Я хотів би оцінити, коли сукупна частота досягне певного значення c . Коли я будую графіки залишків та встановлених значень, я отримую прекрасну синусоїдальну поведінку.у=ах+бc

Тепер, щоб додати ще одне ускладнення, зауважте, що у залишках сюжети

alt текст

є два цикли, які мають менші значення, ніж інші, що являє собою ефект вихідного дня, який також потрібно враховувати.

Отже, куди я їхати звідси? Як я можу поєднати якийсь косинус, синус або циклічний термін у регресійній моделі до ок. оцінити, коли кумулятивна частота буде дорівнює ?c

Відповіді:


9

Ви можете спробувати чудовий stl()метод - він розкладає (використовуючи ітераційну loess()підгонку) на тренд, сезонний та залишок. Це може просто підняти тут ваші коливання.


8

Якщо ви знаєте частоту коливань, ви можете включити два додаткові прогнози, sin (2π wt) і cos (2π wt) - встановити w, щоб отримати бажану довжину хвилі - і це буде моделювати коливання. Вам потрібні обидва умови, щоб відповідати амплітуді та фазовому куту. Якщо є більше однієї частоти, вам знадобиться синусоїдальний і косинуальний термін для кожної частоти.

Якщо ви не знаєте, що таке частоти, стандартним способом ізоляції декількох частот є зменшення даних (отримати залишки від лінійного пристосування, як ви це зробили) та запустити дискретне перетворення Фур'є проти залишків. Швидкий і брудний спосіб зробити це в MS-Excel, який має допоміжний інструмент аналізу Фур’є у додатку Аналіз даних. Запустіть аналіз проти залишків, візьміть абсолютне значення перетворень та отримайте графік результату. Піки стануть вашими основними частотними компонентами, які ви хочете моделювати.

Коли ви додаєте ці циклічні передбачувачі, зверніть пильну увагу на їх р-значення у вашій регресії, і не перестарайтеся. Використовуйте лише ті частоти, які є статистично значущими. На жаль, це може ускладнити встановлення низьких частот.


2
Коли ви оцінюєте частоти з даних (як при аналізі Фур'є) і потім включаєте їх як терміни sin / cos в регресію, їхні p значення будуть безглуздими.
whuber

4

Для початку почнемо з того, що звичайні найменші квадрати, придатні для цих даних, ймовірно, недоречні. Якщо окремі дані, накопичений передбачаються, як правило, мають компоненти випадкової помилки, то помилка в сукупних даних ( НЕ то накопичені частоти --that що - то інше , ніж те , що у вас є) є сукупною сумою всіх членів помилки. Це робить сукупні дані гетероскедастичними (вони з часом стають все більш змінними) і сильно позитивно корелюють. Оскільки ці дані так регулярно поводяться, і їх так багато, проблем із пристосуванням мало ви отримаєте, але ваші оцінки помилок, ваші прогнози (про що йдеться в питанні), і особливо ваші стандартні помилки прогнозування можуть бути далеко відхилені.

Стандартна процедура аналізу таких даних починається з вихідних значень. Візьміть щоденні відмінності, щоб видалити синусоїдальний компонент високої частоти. Візьміть щотижневі відмінності, щоб усунути можливий цикл тиждень-тиждень. Проаналізуйте, що залишилося. Моделювання ARIMA - це потужний гнучкий підхід, але почніть просто: графік цих відмінних даних, щоб побачити, що відбувається, а потім рухайтеся звідти. Зауважте також, що за даними менш ніж за два тижні ваші оцінки тижневого циклу будуть поганими, і ця невизначеність буде домінувати над невизначеністю прогнозів.


2

Очевидно, що домінуюче коливання має період один день. Схоже, є й компоненти низької частоти, що стосуються дня тижня, тому додайте компонент із частотою один тиждень (тобто одна сьома дня) та перші кілька його гармонік. Це дає модель форми:

Е(у)=c+а0cos(2πт)+б0гріх(2πт)+а1cos(2πт/7)+б1гріх(2πт/7)+а2cos(4πт/7)+б2гріх(4πт/7)+

- припускаючи твимірюється в днях. Осьу- це вихідні дані, а не його сукупна сума.


-2

Чому б не просто використати GA, щоб знайти амплітуду, період та фазу ряду синусів (або косинусів) послідовно, а потім поєднувати. Оптимізуйте наступне: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS


1
Незрозуміло, як це відповідає на питання про обчислення функції зворотної кумулятивної частоти. А що ви маєте на увазі під "GA"? Генетичний алгоритм? Щось ще?
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.