Запитання з тегом «lstm»

Довга короткострокова пам'ять (LSTM) - це нейронна мережева архітектура, що містить повторювані NN-блоки, здатні запам'ятовувати значення на довільний проміжок часу.

2
Чому RNN з одиницями LSTM також можуть страждати від "вибуху градієнтів"?
У мене є основні знання про те, як працюють RNN (і, зокрема, з одиницями LSTM). У мене є живописне уявлення про архітектуру блоку LSTM, тобто клітинки та декількох воріт, які регулюють потік значень. Однак, мабуть, я не до кінця зрозумів, як LSTM вирішує проблему "зникаючих та вибухаючих градієнтів", яка виникає …

2
Поводження з невідомими словами в задачах моделювання мови за допомогою LSTM
Для завдання з обробки природних мов (NLP) часто використовуються вектори word2vec як вбудовування для слів. Однак може бути багато невідомих слів, які не фіксуються векторами word2vec просто тому, що ці слова бачать недостатньо часто в навчальних даних (у багатьох реалізаціях використовується мінімальна кількість, перш ніж додати слово до словника). Особливо …

1
Прогнозування часових рядів за допомогою ARIMA проти LSTM
Проблема, з якою я маю справу, - передбачення значень часових рядів. Я переглядаю по одному часовому ряду і, базуючись, наприклад, на 15% вхідних даних, я хотів би передбачити його майбутні значення. Поки що я натрапив на дві моделі: LSTM (довготривала короткочасова пам'ять; клас періодичних нейронних мереж) АРІМА Я спробував обидва …

3
Структура періодичної нейронної мережі (LSTM, GRU)
Я намагаюся зрозуміти архітектуру RNN. Я знайшов цей підручник, який був дуже корисним: http://colah.github.io/posts/2015-08-U Understanding-LSTMs/ Особливо це зображення: Як це вписується у мережу передачі даних? Це зображення лише черговий вузол у кожному шарі?

1
Розуміння топології LSTM
Як і багато інших, я знайшов ресурси тут і тут надзвичайно корисними для розуміння клітин LSTM. Я впевнений, що я розумію, як величини течуть і оновлюються, і я досить впевнений, щоб додати також згадані "підключення" та ін. У своєму прикладі я маю на кожному етапі вхідний вектор довжини iта вихідний …

2
Найкраще використовувати LSTM для прогнозування подій послідовності
Припустимо наступну 1 розмірну послідовність: A, B, C, Z, B, B, #, C, C, C, V, $, W, A, % ... Букви A, B, C, ..тут представляють "звичайні" події. Символи #, $, %, ...тут представляють "особливі" події Тимчасовий проміжок між усіма подіями неоднаковий (що завгодно від секунд до днів), хоча …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.