Запитання з тегом «lstm»

3
Розуміння Керасу LSTM
Я намагаюся узгодити своє розуміння LSTM і наголосив тут, на цій посаді Крістофер Олах, реалізований у Керасі. Я стежу за блогом, написаним Джейсоном Браунлі для підручника «Керас». Що я в основному плутаю, це Перестановка рядів даних у [samples, time steps, features]та, Державні LSTM Давайте зосередимось на двох вищезазначених питаннях з …

6
Як застосувати відсікання градієнта в TensorFlow?
Розглядаючи приклад коду . Я хотів би знати, як застосувати відсікання градієнта в цій мережі на RNN, де існує можливість вибуху градієнтів. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) Це приклад, який можна використати, але де я можу це ввести? У def RNN lstm_cell = rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0) # Split data because rnn cell …

6
PyTorch - суміжний ()
Я переглядав цей приклад мовної моделі LSTM на github (посилання) . Що це взагалі робить, мені цілком зрозуміло. Але я все ще намагаюся зрозуміти, що contiguous()робить виклик , який кілька разів трапляється в коді. Наприклад, у рядку 74/75 коду створюються вхідні та цільові послідовності LSTM. Дані (що зберігаються ids) є …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.