9、反向传播算法深入解析

反向传播算法深入解析

1. 反向传播算法基础

在神经网络中,反向传播算法是一种用于计算梯度的有效方法,在训练神经网络时起着关键作用。通常,使用预激活变量进行反向传播比使用后激活变量更为常见。下面是使用预激活变量的反向传播算法的伪代码:

初始化:对于每个输出节点 $t_r$($r \in \{1, \ldots, k\}$),设置 $\Delta(t_r) = \frac{\partial L}{\partial y(t_r)} = \Phi'(a(t_r))\frac{\partial L}{\partial h(t_r)}$;
重复:
    选择一个未处理的节点 $i$,使得其所有输出节点 $j \in A(i)$ 的 $\Delta(j)$ 值都已知;
    更新 $\Delta(i) \Leftarrow \Phi'_i \sum_{j \in A(i)} w_{ij} \Delta(j)$;
直到所有节点都被选择;
对于每条边 $(j, i)$ 及其权重 $w_{ji}$,计算 $\frac{\partial L}{\partial w_{ji}} = \Delta(i) h(j)$;

反向传播算法具有广泛的适用性,它不仅可以用于常见的前馈神经网络,还可以用于任何无环的参数化计算图。例如,有一种神经网络允许随机特征包直接输入到隐藏层,即使在这种非常规架构下,上述反向传播伪代码依然有效,只要计算图是有向无环图即可。此外,只要计算节点中的函数可微,就可以在其中使用任何类型的函数。

2. 激活函数的导数

在反向传播算法的更新过程中,需要用到各种激

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值