神经网络简介-多层神经网络

本文介绍了神经网络的基础知识,重点讨论了具有三层结构的神经网络,详细阐述了输入层、隐藏层和输出层的标记方式以及权重计算。同时,文章对比了批量梯度下降和随机梯度下降两种权重更新方法,前者适用于小规模训练数据,全局最优但计算量大;后者则在大规模训练数据中展现快速收敛特性,但可能带来模型误差。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上一节介绍了神经元及相关内容,本节我们看一下神经网络

图1
如上图所示,该神经网络有三层。我们标记第一层(也就是输入层)为 a(1) ,第一层与第二层连接权重为 w(1) ,然后第一层输入与第一层权重的线性和为 z(1) ,第一层神经元个数为 n(1) ,并依次标记剩余网络层。
可以看出,存在

z(l)j=i=1n(l)a(l)iw(l)i,j=a(l)w(l)j

a(l+1)=f(z(l))

f() 是激活函数。

对于多层神经网络,我们定义其代价函数为

J(w,b)=12ni=in(yih(xi))2

其中 (xi,yi) 是样本集合, h() 是网络预测函数,通常为了防止过拟合,需要在后面加上一项正则项,用来约束参数复杂度。
当网络预测结果( h() )与样本的ground truth( yi )接近时,代价函数最小。换言之,我们要想使得预测结果准确,那么需要最小化代价函数 J()
此时,利用梯度下降算法,我们知道参数的更新公式如下所示:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值