Статистичний тест для перевірки, коли два подібних часових ряду починають розходитися


10

Щодо назви, я хотів би знати, чи існує статистичний тест, який може допомогти мені виявити значну розбіжність між двома подібними часовими рядами. Зокрема, дивлячись на рисунок нижче, я хотів би виявити, що серії починають розходитися в момент t1, тобто коли різниця між ними починає бути значною. Більше того, я б також виявив, коли різниця між серіями повертається не суттєво.

Чи є корисний статистичний тест для цього?

введіть тут опис зображення

Відповіді:


7

Є кілька способів, які приходять на думку. Перший - взяти різницю між двома серіями та створити "нову серію". Проаналізуйте цю серію та емпірично визначте імпульси, зрушення рівня / місцеві тенденції часу та можливий компонент ARIMA. Результати можуть / можуть запропонувати будь-яку ідентифікаційну розбіжність. Другий підхід полягає у створенні загальної моделі ARIMA для обох часових рядів та використанні тесту CHOW для тестування на статистично значущі параметри.


1

Ще один підхід, який може працювати - це розглянути алгоритми виявлення змін.

Перша ідея - застосувати метод виявлення змін на зразок CUSUM для обох серій та порівняти точки зміни. У вашому прикладі дуже ймовірно, що червоний ряд дасть точку зміни при t1, тоді як жовтий не буде. Цікаво, що і червоний, і жовтий, ймовірно, можуть призвести до точки зміни на першому ударі кривої (залежно від чутливості параметрів CUSUM), але ви насправді не проти, оскільки вони поводяться аналогічно.


1

Деякі варіанти, які ви можете розглянути:

  1. Якщо ви хочете визначити суттєву різницю, діаграма контролю статистичних процесів (SPC) з використанням правил Western Electric також може допомогти вам визначити, що це відбувається. Як підказав @IrishStat, найкраще почати графік різниці між двома часовими рядами. Тоді добре застосовувати правила SPC на основі аналізу стабільного періоду двох часових рядів.

https://en.wikipedia.org/wiki/Western_Electric_rules

  1. Більш детальний прагматичний підхід - це хроностатистика, яка набуває широкого визнання в гірничій галузі для виявлення змін та специфічних характеристик шуму в даних часових рядів. Як ви можете уявити, в умовах, коли вас цікавить 0,001% матеріалу, слід розуміти невизначеність вибірки та мінливість процесу, щоб знати, чи є різниця у двох часових рядах.

Як інженер з шахтних процесів я звик мати справу з даними часових рядів, що набагато шумніше, ніж це, а хроностатистика (серед прихильників П'єр Джи та Френсіс Пітард) дозволяє виявити помилки, введені методом вибірки даних та іншими аспектами даних збір. Більш доступні документи (тобто простіші для непрофесійних статистиків) були написані Тімом Нап'є-Манном, який має дуже застосований підхід до оцінки даних часових рядів.

Мені невідомі жодні документи з відкритим кодом, але обидва ці автори опублікували через Elsevier.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.