1
Навчальні нейронні мережі виявляють надзвичайно малі значення NaN
Я намагаюся реалізувати архітектуру нейронної мережі в Haskell і використовувати її на MNIST. Я використовую hmatrixпакет для лінійної алгебри. Моя навчальна база побудована за допомогою pipesпакету. Мій код компілюється і не дає збою. Але проблема полягає в тому, що певні комбінації розміру шару (скажімо, 1000), розміру міні-партії та швидкості навчання …