对深度学习训练模型过程的理解

本文介绍了一个典型的神经网络训练过程:从数据预处理开始,到数据输入神经网络进行正向传播获得得分;接着利用误差函数计算损失并与期望值对比;通过反向传播确定梯度向量;最后依据梯度调整权重直至训练完成。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.数据预处理
二.将数据输入神经网络(每个神经元先输入值加权累加再输入激活函数作为该神经元的输出值)正向传播,得到得分
三.将“得分”输入误差函数(正则化惩罚,防止过度拟合),与期待值比较得到误差,多个则为和,通过误差判断识别程度(损失值越小越好)
四.通过反向传播(反向求导,误差函数和神经网络中每个激活函数都要求,最终目的是使误差最小)来确定梯度向量
五.最后通过梯度向量来调整每一个权值,向“得分”使误差趋于0或收敛的趋势调节
六.重复上述过程直到设定次数或损误差失的平均值不再下降(最低点)
训练完成
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值