Я використовую VT-бібліотеку статистичних моделей python для моделювання даних фінансових часових рядів, і деякі результати мене здивували. Я знаю, що моделі VAR припускають, що дані часових рядів є нерухомими. Я ненавмисно помістив нестаціонарну серію цін журналів на два різні цінні папери, і на диво пристосовані значення та вибіркові прогнози були дуже точними з відносно незначними, нерухомими залишками. на прогнозі в-зразок становив 99% , а стандартне відхилення прогнозу залишкової серії становило близько 10% від прогнозних значень.
Однак, коли я відрізняю ціни на журнал і підхожую цей часовий ряд до моделі VAR, встановлені та прогнозні значення далекі від позначки, підстрибуючи в тісному діапазоні навколо середнього. В результаті залишки виконують кращу роботу прогнозування повернень журналу, ніж встановлені значення, при цьому стандартне відхилення залишків прогнозу на 15X більше, ніж встановлений ряд даних, значення .007 для серії прогнозів.
Я неправильно трактую примірник проти залишків на моделі VAR або роблю якусь іншу помилку? Чому нестаціонарний часовий ряд призведе до більш точних прогнозів, ніж стаціонарний на основі одних і тих же базових даних? Я добре працював з моделями ARMA з тієї ж бібліотеки python і не бачив нічого подібного до моделювання даних про одну серію.