softmax cross_entropy

本文探讨了交叉熵代价函数如何通过消除激活函数导数的影响,加速机器学习过程。相较于传统二次代价函数,交叉熵能确保即使在激活函数导数较小的情况下,学习速率也不会减缓。更具体地说,当预测值与实际值偏差较大时,交叉熵能够提供更强的学习动力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

softmax函数作用

交叉熵代价函数的优点
一般的代价函数比如二次代价函数,对参数w或者b求偏导之后,结果和激活函数的导数成正比,也就是说当激活函数导数很小的时候(随机初始化导致激活函数输入小,从而对应导数大),学习就会变得很慢。
而如果使用交叉熵的代价函数,最后激活函数的导数项会抵消,只剩下x和激活函数本身,w的梯度只和输入值与实际值之间的差值成正比,也就是说,误差越大,学习速率就会越快。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值