Багатоваріантний часовий ряд у Р. Як знайти відсталу кореляцію та побудувати модель прогнозування


16

Я новачок на сторінці та досить нова статистика та Р. Я працюю над проектом для коледжу з метою знайти співвідношення між дощем та рівнем потоку води в річках. Як тільки кореляція буде доведена, я хочу її передбачити / передбачити.

У мене є сукупність даних за декілька років (що приймаються кожні 5 хвилин) для конкретних річок, що містять:

  • Опади в міліметрах
  • Течія річки в кубічних метрах на секунду

Ця річка не має снігу, тому модель заснована лише на дощі та часі. Інколи спостерігаються морози, але я думаю про те, щоб вилучити ці періоди з даних як переживачів, оскільки ця ситуація виходить за рамки мого проекту.

Приклади Тут у вас є кілька сюжетів зразкових даних про дощ і підйом води через кілька годин.

Більший приклад за кілька днів

Коротший приклад лише один період опадів

Червона лінія - річковий потік. Помаранчевий - дощ. Ви можете бачити, що завжди йде дощ, перш ніж вода піднімається в річці. У кінці тимчасового ряду знову починається дощ, але це вплине на течію річки пізніше.

Кореляція є. Ось що я зробив у R, щоб довести кореляцію за допомогою ccf в R:

  • перехресна кореляція
  • провідна змінна
  • відставання

Це мій рядок R, який використовується для другого прикладу (один період опадів):

ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")

результат ccf для малого прикладу 2

Моє тлумачення:

  • що дощ приводить (трапляється спочатку),
  • є значна кореляція, яка досягає максимального відставання в (я можу перевірити точну кількість, я знаю цю частину).450
  • Я не знаю, як дізнатись час, коли кореляція впливає на течію річки, я думаю, що назва - «утримання». Що я бачу, це графік слід за тією ж формою першого графа, коли річка втрачає воду після дощу. Я не вважаю, що виходячи з цього, я можу сказати, що утримання триває від коли воно досягає (я можу перевірити це в об'єкті, створеному в кадрі даних, повернутий і побачити, коли рівень води повертається до значення "перед дощем". Це правильно? Чи є кращий спосіб знайти утримання?450800ccf

Я правий?

Про часовий ряд . Цей часовий ряд не має періодичності чи сезонності. Дощ може прийти будь-коли і спричинити вплив. Це влітку зменшується, але все ж трапляється, це район з великим дощем цілий рік.

Модель та прогноз Я не знаю, як створити модель, щоб можна було робити прогноз, який підказує мені, на скільки річка збирається збільшити обсяг після періоду дощу. Я пробував деякі arima, auto arimaале не був дуже успішним. Повинен чи я використовувати Arima, varsабо інша різна багатовимірна модель? Будь-яке посилання на приклад допомогло б вам.

Будь ласка, дайте мені знати, якщо ви знаєте найкращий спосіб створити цей прогноз, яку модель я повинен використовувати. Є кілька інших речей, які я розглядаю, але я їх вийняв із цього пояснення для простоти. Я можу поділитися деякими даними, якщо потрібно.


ви шукаєте аналіз втручання (підмножина називається "дослідження подій" у соціальних дослідженнях)
Константинос

Відповіді:


3

Вам потрібно використовувати поведінку ACF & PACF, щоб допомогти визначити, яка модель краще відповідає вашим даним (наприклад, наявність повільного занепаду в графіку ACF вказує на те, що диференціація може знадобитися для того, щоб зробити серію більш стабілізованою. Ваш графік ACF очевидно показує, що якийсь вид Коли ви користуєтеся правильним перетворенням (стаціонарні серії), коливання має бути менш різноманітним і в межах синіх ліній. Коли ви зробили свою серію нерухомою, подумайте, яка модель AR, MA, ARMA чи ARIMA підходить. У своєму проекті я зробив наступне, щоб допомогти у виборі моделі:

Діаграма ACF показує відносно велике значення при відставанні 2 ( дивіться, де це у вашому сюжеті ). Крім того, він стає по суті нульовим при відставаннях більше двох. Це говорить про те, що модель MA (2) може відповідати даним, і тоді, переглядаючи графік PACF, ми відразу помічаємо, що кореляція дорівнює нулю майже у всіх відставаннях. Це може підказати, що модель не має жодної частини AR на ній ( підкоригуйте це відповідно до своєї ділянки). Тому однією з наших кандидатських моделей може бути ARIMA (p, d, q) з параметрами p = 0, d = 1 та q = 1 або2. Я також спробував кілька вищих порядків МА і розглядав певну можливість для участі AR в моделі, щоб порівняти результати AIC, AICc і BIC і визначитися з кінцевою моделлю. Наступний крок вам потрібно буде виконати кілька діагностичних тестів, щоб переконатися, що ви вибрали правильну модель і немає шаблону у ваших залишках (ACF & PACF для залишків, p-значення для статистики Ljung-Box, історіограма для залишків та QQ сюжет). Сподіваюся, це допомагає!

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.