Часто згадується, що випрямлені лінійні одиниці (ReLU) витіснили одиниці softplus, оскільки вони лінійні та швидші для обчислення.
Чи є у softplus все-таки перевага, що викликає розрідженість, або це обмежено для ReLU?
Причина, яку я запитую, це те, що я цікавлюсь негативними наслідками нульового схилу ReLU. Хіба ця властивість не «захоплює» одиниці на нулі, де може бути корисно надати їм можливість реактивації?