https://blog.youkuaiyun.com/huwenxing0801/article/details/82791879
可以看见使用交叉熵作为损失函数后,反向传播的梯度不在于sigmoid函数的导数有关了。这就从一定程度上避免了梯度消失。
https://blog.youkuaiyun.com/huwenxing0801/article/details/82791879
可以看见使用交叉熵作为损失函数后,反向传播的梯度不在于sigmoid函数的导数有关了。这就从一定程度上避免了梯度消失。