Проблема, з якою я маю справу, - передбачення значень часових рядів. Я переглядаю по одному часовому ряду і, базуючись, наприклад, на 15% вхідних даних, я хотів би передбачити його майбутні значення. Поки що я натрапив на дві моделі:
Я спробував обидва і прочитав деякі статті про них. Зараз я намагаюся краще зрозуміти, як порівнювати це. Що я знайшов поки що:
- LSTM працює краще, якщо ми маємо справу з величезною кількістю даних і доступно достатньо даних про навчання, тоді як ARIMA краще для менших наборів даних (це правильно?)
- ARIMA вимагає ряд параметрів,
(p,q,d)
які повинні бути розраховані на основі даних, тоді як LSTM не вимагає встановлення таких параметрів. Однак є деякі гіперпараметри, які нам потрібні для налаштування LSTM.
Крім вищезгаданих властивостей, я не міг знайти жодних інших моментів чи фактів, які могли б допомогти мені вибрати найкращу модель. Я був би дуже вдячний, якби хтось міг допомогти мені знайти статті, документи чи інші речі (до цього часу не пощастило, лише деякі загальні думки тут і там, і нічого не грунтуючись на експериментах).
Я мушу зазначити, що спочатку я маю справу з потоковими даними, однак наразі я використовую набори даних NAB, що включає 50 наборів даних із максимальним розміром 20k точок даних.