神经网络--反向传播

本文介绍了神经网络中的反向传播算法,从简单的单神经元模型开始,使用sigmoid激活函数。通过前向传播计算网络输出,然后利用批量梯度下降法更新参数,以最小化损失函数。反向传播过程中,误差通过权重矩阵的转置从输出层反传到隐藏层,简化更新公式并引入delta变量以减少重复计算,实现权重和偏置的高效更新。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以监督学习为例,假设我们有训练样本集(x,y),那么神经网络算法能够提供一种复杂且非线性的假设模型h_{w,b}(x),模型具有参数w,b,可以以此参数来拟合我们的数据。

为了描述神经网络,我们从最简单的神经网络讲起,这个神经网络仅由一个“神经元”构成,输入x=[x_1,x_2,x_3],偏置b=1

这里我们把激活函数f选择成sigmoid函数,其导数计算比较简单f'(z)=f(z)(1-f(z)),模型输出为

h_{w,b}(x)=f(wx+b)=sigmoid(\sum_{i=1}^{3}w_ix_i+b),

比较复杂的神经网络模型是由许多单一的“神经元”联接在一起的,

简单起见,用z_i^l表示第L层第i单元的输入加权和(包含偏置),比如

z_i^2=\sum _{j=1}^nw_{ij}^1x_j+b_i^1

a_i^l=f(z_i^l)表示第L层第i单元的输出。则网络模型输出为

h_{w,b}(x)=a^3=f(z^3)

其中,注意下面的指数2,3表示2,3层,而不是平方或立方

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值