ПОЛІ ГРУ
c~t=tanh(Wc[Gr∗ct−1,xt]+bc)
Gu=σ(Wu[ct−1,xt]+bu)
Gr=σ(Wr[ct−1,xt]+br)
ct=Gu∗c~t+(1−Gu)∗ct−1
at=ct
Блок LSTM
c~t=tanh(Wc[at−1,xt]+bc)
Gu=σ(Wu[at−1,xt]+bu)
Gf=σ(Wf[at−1,xt]+bf)
Go=σ(Wo[at−1,xt]+bo)
ct=Gu∗c~t+Gf∗ct−1
at=Go∗tanh(ct)
Як видно з рівнянь, LSTM мають окремі ворота оновлення та ворота забуття. Це очевидно робить LSTM і більш складними, але в той же час і складнішими. Немає простого способу вирішити, який використовувати для конкретного випадку використання. Ви завжди повинні робити проби та помилки, щоб перевірити продуктивність. Однак, оскільки GRU простіший за LSTM, для навчання GRU знадобиться набагато менше часу та ефективніші.
Кредити: Андрій Нг