交叉熵损失函数

交叉熵损失函数解析

1.什么是交叉熵?

公式:

\large L=\sum -[y_{i}log^{p_{i}}+(1-y_{i})log^{(1-p_{i})}]   (总是忘记这里的负号

\large y_{i}:  表示真实值

\large {p_{i}}:  表示预测值

 

分类问题中,我们通常使用 交叉熵来做损失函数,在网络的后面 接上一层 softmax

\large softmax(y_{i})=\frac{e^{y_{i}}}{\sum e^{y_{i}} }将数值(score)  转换成概率。

如果是二分类问题,我们通常使用 sigmod 函数 \large sigmod(x)=\frac{1}{1+e^{-x}}

2.为什么使用交叉熵损失函数?

如果分类问题使用 MSE(均方误差) 的方式,在输出概率接近0 或者 接近1的时候,偏导数非常的小,学习速率就会特别慢。

而使用交叉熵损失函数,不会出现上述的问题。

 

损失函数 是通过 链式求导法则,对网络中的权值进行作用的。

 

参考博客:

1.https://zhuanlan.zhihu.com/p/35709485

2.https://zhuanlan.zhihu.com/p/35707643

3.https://blog.youkuaiyun.com/weixin_37567451/article/details/80895309

4.https://blog.youkuaiyun.com/red_stone1/article/details/80735068

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值