Який найкращий статистичний тест для часового ряду?


16

У мене простий часовий ряд з 5-10 точками даних на набір даних через регулярні інтервали. Мені цікаво, який найкращий спосіб визначити, чи відрізняються два набори даних. Чи варто спробувати тести на кожній точці даних, або подивитися на ділянку під кривими, чи є якась багатоваріантна модель, яка б працювала краще?


Що ви маєте на увазі під "різними"?
Шейн

Що ви маєте на увазі під "5-10 точок даних на набір даних "?
Стефан Коласа

Я думаю, що у нього є колекція з декількох часових рядів, кожен з яких має 5-10 спостережень.
Роб Хайндман

Я все ще думаю, що на це питання майже неможливо відповісти, не розуміючи, що означає "різне" ...
Шейн

Мої висловлювання за питання, що не відповідають питанням. Я по-різному маю на увазі, чи є різниця між двома групами лікування протягом часового ряду (а не в окремих точках). Були б міжпредметні зміни (які, я думаю, потрібно було б врахувати), а також міжгрупові варіації (що мене цікавить).
Дейв

Відповіді:


11

Вам потрібно буде точно вказати, що ви маєте на увазі під "різними". Вам також потрібно буде вказати, які припущення ви готові зробити щодо структури послідовних кореляцій у кожному часовому ряді.

За допомогою t-тестів ви порівнюєте середнє значення для кожної групи і ви припускаєте, що групи складаються з незалежних спостережень з рівними відхиленнями (останні іноді розслаблені). Під час тестування часових рядів припущення про незалежність зазвичай не є розумним, але тоді вам потрібно замінити його на задану кореляційну структуру - наприклад, ви можете припустити, що часовий ряд дотримується процесів AR (1) з рівною автокореляцією. Отже, навіть порівнювати засоби двох чи більше часових рядів значно складніше, ніж із незалежними даними.

Я ретельно уточнив, які припущення я готовий зробити щодо кожного часового ряду, і що я хотів порівняти, а потім використати параметричний завантажувальний засіб (на основі припущеної моделі) для проведення тесту.


6

Можливо, багаторазові заходи anova - це те, що ти хочеш. Це дозволяє порівнювати випробовуваних (міжпредметних факторів), приймаючи корельовану структуру "часового ряду" для кожного суб'єкта (внутрішньопредметний фактор). Це простий, але датований метод, і його можна знайти в контексті "загальних лінійних моделей", йому потрібні деякі додаткові функції (наприклад, сферичність). Іншим способом можуть бути змішані лінійні моделі, які дозволяють отримати більш загальні кореляційні структури (навіть AR (1), як запропонував Роб) і незбалансовані дані.


2

Якщо ви хочете припустити просту лінійну тенденцію, ви можете взяти різницю кожного набору даних у різні моменти часу та перевірити, чи нахил лінії дорівнює нулю.

-Ральф Зимовий

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.