Відповіді:
LSTM має набір з 2 матриць: U і W для кожного з (3) воріт. (.) На діаграмі вказує множення цих матриць на вхід і вихід .
Отже, загальна кількість параметрів =
Однак у випадку, якщо ваш LSTM включає вектори зміщення ( це наприклад за замовчуванням у керах ), число стає:
Відповідно до цього :
LSTM структура клітин
Рівняння LSTM
Внесення нелінійностей
Якщо вхідний x_t має розмір N × 1, і є D осередки пам'яті, то розмір кожного з W * і U * є д × п і д × d відповідно. Розмір W тоді буде 4d × (n + d) . Зауважте, що кожна з комірок пам’яті dd має власні ваги W ∗ та U ∗ , і єдине значення значень комірок пам’яті, яке ділиться з іншими одиницями LSTM, відбувається під час виробу з U ∗ .
Дякуємо Арун Маллі за чудову презентацію.