Я заздалегідь прошу вибачення за те, що я все-таки підходжу до цього. Я намагаюся зрозуміти плюси і мінуси використання tanh (карта від 1 до 1) проти сигмоїда (карта 0 до 1) для моєї функції активації нейрона. З мого читання це звучало як незначна річ з граничними відмінностями. На практиці у зв'язку із своїми проблемами я вважаю, що сигмоїду легше тренувати і як не дивно, сигмоїда, здається, краще знайде загальне рішення Під цим я маю на увазі, що коли сигмоїдна версія закінчується навчанням, вона добре справляється з еталонним (непідготовленим) набором даних, де танг-версія, здається, зможе отримати правильні відповіді на дані тренувань, роблячи погану роботу по довідці. Це для тієї ж мережевої архітектури.
Я маю інтуїцію, що за допомогою сигмоїди нейрону легше майже повністю вимкнутись, таким чином не забезпечуючи введення в наступні шари. Тану тут важче, оскільки йому потрібно повністю скасувати свої введення, інакше він завжди надає значення наступному шару. Можливо, ця інтуїція помилкова.
Довгий пост. Підсумок, що таке торгівля, і чи має це мати велике значення?