深度学习--神经网络基础(2)

本文详细介绍了深度学习中常用的损失函数,如多分类交叉熵、二分类交叉熵、回归任务中的MAE、MSE和SmoothL1,以及优化算法如梯度下降、Momentum、AdaGrad、RMSprop和Adam。同时讨论了指数加权平均和正则化策略,如DropOut和批量归一化,以提高模型的泛化性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

损失函数

在深度学习中, 损失函数是用来衡量模型参数的质量的函数 , 衡量的方式是比较网络输出和真实输
出的差异:

分类

1.多分类损失函数

在多分类任务通常使用 softmax logits 转换为概率的形式,所以多分类的交叉熵损失也叫做 softmax 损失 ,它的计算方法是:

其中:
1. y 是样本 x 属于某一个类别的真实概率
2. f(x) 是样本属于某一类别的预测分数
3. S softmax 激活函数 , 将属于某一类别的预测分数转换成概率
4. L 用来衡量真实值 y 和预测值 f(x) 之间差异性的损失结果

2.二分类任务损失交叉熵

在处理二分类任务时,我们不再使用softmax激活函数,而是使用sigmoid激活函数,那损失函数也相应的进行调整, 使用二分类的交叉熵损失函数:

其中:
1. y是样本x属于某一个类别的真实概率
2. 而y^是样本属于某一类别的预测概率
3. L用来衡量真实值y与预测值y^之间差异性的损失结果。

3.回归任务损失函数

MAE损失函数

Mean absolute loss(MAE)也被称为L1 Loss,是以绝对误差作为距离。损失函数公式:

曲线如下图所示:

特点是:
1. 由于L1 loss具有稀疏性,为了惩罚较大的值,因此常常将其作为 正则项添加到其他loss中作为约束。
2. L1 loss的最大问题是梯度在零点不平滑,导致会跳过极小值。
MSE损失函数
Mean Squared Loss/ Quadratic Loss(MSE loss) 也被称为L2 loss,或欧氏距离,它以误差的平方和的均值作为距离,损失函数公式:

曲线如下图所示:

特点是:
1. L2 loss也常常作为正则项。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值