Прогнозування часових рядів за допомогою ARIMA проти LSTM


10

Проблема, з якою я маю справу, - передбачення значень часових рядів. Я переглядаю по одному часовому ряду і, базуючись, наприклад, на 15% вхідних даних, я хотів би передбачити його майбутні значення. Поки що я натрапив на дві моделі:

  • LSTM (довготривала короткочасова пам'ять; клас періодичних нейронних мереж)
  • АРІМА

Я спробував обидва і прочитав деякі статті про них. Зараз я намагаюся краще зрозуміти, як порівнювати це. Що я знайшов поки що:

  1. LSTM працює краще, якщо ми маємо справу з величезною кількістю даних і доступно достатньо даних про навчання, тоді як ARIMA краще для менших наборів даних (це правильно?)
  2. ARIMA вимагає ряд параметрів, (p,q,d)які повинні бути розраховані на основі даних, тоді як LSTM не вимагає встановлення таких параметрів. Однак є деякі гіперпараметри, які нам потрібні для налаштування LSTM.

Крім вищезгаданих властивостей, я не міг знайти жодних інших моментів чи фактів, які могли б допомогти мені вибрати найкращу модель. Я був би дуже вдячний, якби хтось міг допомогти мені знайти статті, документи чи інші речі (до цього часу не пощастило, лише деякі загальні думки тут і там, і нічого не грунтуючись на експериментах).

Я мушу зазначити, що спочатку я маю справу з потоковими даними, однак наразі я використовую набори даних NAB, що включає 50 наборів даних із максимальним розміром 20k точок даних.


1
Чому б вам не просто спробувати дві моделі на частині своїх даних, подивитися, яка з них краще прогнозувати, і вибрати її. Або використовувати обидві моделі та комбінувати їх прогнози. Комбінації прогнозів часто перевершують окремі прогнози.
Річард Харді

@RichardHardy Я вже це зробив і знаю їхню ефективність на моїх наборах даних. Я намагаюся краще зрозуміти обидва, особливо їх недоліки, щоб побачити, хто з них може бути найкращим кандидатом для обробки майбутніх зразків даних.
ахаджіб


Будь ласка, прочитайте довідковий центр - зокрема третій останній абзац, в якому сказано: " Однак, зауважте, що перехресне розміщення повідомлень не рекомендується на сайтах ДП. Виберіть найкраще місце для розміщення свого запитання. Пізніше, якщо він виявиться більш підходящим на інший сайт, його можна перенести. "
Glen_b -Встановіть Моніку

Відповіді:


3

Порівняння моделей штучної нейронної мережі та часових рядів для прогнозування цін на товари порівнює результати ANN та ARIMA при прогнозуванні фінансових часових рядів. Я думаю, що це хороша відправна точка для вашого огляду літератури.

У багатьох випадках нейронні мережі, як правило, перевершують моделі на основі АР. Однак я вважаю, що одним із головних недоліків (про який не йдеться в академічній літературі) при більш досконалих методах машинного навчання є те, що вони використовують чорні скриньки. Це велика проблема, якщо вам довелося пояснити, як модель працює тому, хто не знає, що багато з цих моделей (наприклад, у корпорації). Але якщо ви робите цей аналіз саме як шкільна робота, я не думаю, що це буде проблемою.

Але, як сказав попередній коментатор, як правило, найкращим способом є формування оцінювача ансамблю, в якому ви поєднуєте дві або більше моделей.


7
Посилання, яке ви цитували, стосується простих незрозумілих нейронних мереж, і воно занадто старе, щоб бути корисним (1990-ті - це століття тому). Питання ОП задає питання про періодичну нейронну мережу з архітектурою LSTM, і ця стаття не охоплює цього.
horaceT

1
Як згадував @horaceT, ця стаття трохи застаріла, і якщо ви можете запропонувати більш пізній документ, який містить інформацію про LSTM, було б дивним. Спасибі
ахаджіб
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.