Мій запропонований підхід охоплює моделі, які набагато більш загальні, ніж ARIMA, оскільки вони включають потенціал для сезонних манекенів, які можуть змінюватися з часом, кілька рівнів, численних тенденцій, параметрів, які можуть змінюватися з часом і навіть відхилень помилок, які можуть змінюватися з часом. Це сімейство більш точно називається моделями ARMAX, але для повної прозорості не виключається (рідкісний) варіант, який має мультиплікативну структуру.
Ви попросили поради, і я вважаю, що це може бути хорошим для початку.
Я б запропонував вам написати код, щоб дотримуватись / імітувати цю блок-схему / робочий процес. "Найкращу модель" можна знайти, оцінивши вказаний вами критерій ... це може бути MSE / AIC вбудованих даних або це може бути MAPE / SMAPE утримуваних даних або будь-який критерій на ваш вибір.
Зауважте, що деталізація кожного з цих кроків може бути досить простою, якщо ви не знаєте про деякі конкретні вимоги / цілі / обмеження аналізу часових рядів, Але це може бути (повинно бути!) Складніше, якщо ви глибше розумієте / вивчення / оцінювання складностей / можливостей, присутніх у ретельному аналізі часових рядів.
Мене попросили дати подальший напрямок щодо того, як слід займатися автоматизацією моделювання часових рядів (або моделювання в цілому) /stats//search?q=peeling+an+onion містить деякі мої вказівки щодо "лущення лука" і пов'язані з ним завдання.
AUTOBOX насправді деталізує та показує проміжні кроки, оскільки це є корисною моделлю і може бути корисним викладачем у цьому плані. Вся наукова ідея полягає в тому, щоб "додати те, що, здається, потрібно" та "видалити те, що видається менш корисним". Це ітеративний процес, запропонований Box і Bacon у більш ранні часи.
Моделі повинні бути досить складними (досить фантазійними), але не надто складними (фантазійними). Якщо припустити, що прості методи працюють зі складними проблемами, не узгоджується з науковим методом за Роджером Беконом і тоннами послідовників Бекона. Як колись сказав Роджер Бекон, і я часто перефразовував: займатися наукою - це пошук повторних зразків. Виявити аномалії - це визначити значення, які не відповідають повторним шаблонам. Бо хто знає шляхи Природи, легше помітить її відхилення, а з іншого боку, хто знає її відхилення, більш точно опише її шляхи. Правила вивчають, спостерігаючи, коли нинішні правила відмовляються. У спірті pf Бекона, виявляючи, коли визначена в даний час "найкраща модель / теорія" є неадекватною, можна потім перейти до "кращого представлення"
З моїх слів "Tukey запропонував дослідницький аналіз даних (EDA), який запропонував схеми вдосконалення моделі на основі очевидних недоліків моделі, запропонованих даними". Це серце AUTOBOX та науки. EDA призначений для того, щоб побачити, що дані можуть сказати нам, поза межами формального завдання моделювання чи тестування гіпотез.
Лакмусовий тест програми автоматичного моделювання досить простий. Він розділяє сигнал і шум без перенапруги? Емпіричні дані свідчать про те, що це можна і було зроблено. Точність прогнозування часто вводить в оману, оскільки майбутнє не відповідає за минуле, і залежно від того, яке походження ви вибираєте, результати можуть і відрізняються.