14、深度学习优化器与模型实现详解

深度学习优化器与模型实现详解

1. 梯度移动平均的归一化

在迭代 $t$ 时,为了使梯度的移动平均成为整个数据集真实梯度 $g$ 的无偏估计,我们定义梯度的归一化移动平均 $\hat{m} {ij}^{(t)}$ 如下:
$\hat{m}
{ij}^{(t)} = \frac{m_{ij}^{(t)}}{1 - \beta_1^t}$

同样,我们定义梯度平方的归一化移动平均 $\hat{v} {ij}^{(t)}$ 如下:
$\hat{v}
{ij}^{(t)} = \frac{v_{ij}^{(t)}}{1 - \beta_2^t}$

每个权重 $w_{ij}$ 的最终更新规则如下:
$w_{ij}^{(t+1)} = w_{ij}^{(t)} - \eta \frac{\hat{m} {ij}^{(t)}}{\sqrt{\hat{v} {ij}^{(t)}} + \epsilon}$

使用示例:

optimizer = tf.keras.optimizers.Adam(learning_rate=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08)

其中, learning_rate 是常数学习率 $\eta$, beta1 beta2 分别对应 $\beta_1$ 和 $\beta_2$, ep

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值