RNN
такі архітектури, як LSTM
і BiLSTM
використовуються в тих випадках, коли проблема навчання є послідовною, наприклад, у вас є відео, і ви хочете знати, що це все, або ви хочете, щоб агент прочитав для вас рядок документа, який є зображенням тексту і є не у текстовому форматі. Я настійно закликаю вас поглянути тут .
LSTMs
і їх двонаправлені варіанти популярні, оскільки вони намагалися навчитися, як і коли забути, а коли не використовувати ворота в їх архітектурі. У попередніх RNN
архітектурах великі проблеми були зниклими градієнтами і змусили ці мережі не так вчитись.
Використовуючи двонаправлене LSTMs
, ви подаєте алгоритм навчання вихідними даними один раз від початку до кінця та один раз від кінця до початку. Тут є дебати, але він зазвичай вчиться швидше, ніж однонаправлений підхід, хоча це залежить від завдання.
Так, ви можете використовувати їх і в навчанні без нагляду, залежно від вашого завдання. погляньте тут і тут .