1.什么是交叉熵?
公式:
(总是忘记这里的负号)
: 表示真实值
: 表示预测值
分类问题中,我们通常使用 交叉熵来做损失函数,在网络的后面 接上一层 softmax
, 将数值(score) 转换成概率。
如果是二分类问题,我们通常使用 sigmod 函数
2.为什么使用交叉熵损失函数?
如果分类问题使用 MSE(均方误差) 的方式,在输出概率接近0 或者 接近1的时候,偏导数非常的小,学习速率就会特别慢。
而使用交叉熵损失函数,不会出现上述的问题。
损失函数 是通过 链式求导法则,对网络中的权值进行作用的。
参考博客:
1.https://zhuanlan.zhihu.com/p/35709485
2.https://zhuanlan.zhihu.com/p/35707643
3.https://blog.youkuaiyun.com/weixin_37567451/article/details/80895309
4.https://blog.youkuaiyun.com/red_stone1/article/details/80735068