DDPG训练过程中梯度恒为0

博主在使用AC全连接网络时遭遇梯度值始终为0的问题,即便loss已显著增大。检查发现,网络权值初始化错误,原本应在【-0.1,0.1】间均匀分布,却因设置不当导致所有权值初始化为-0.1,从而引发梯度恒为0。调整后,梯度恢复正常。

AC都用的简单的全连接,两层,结果梯度值总是0,即使loss已经很大了,梯度仍然是0.

检查发现,网络权值初始化的时候出了问题,我自己定义的初始化,本来是在一个区间【-0.1,0.1】之间均匀分布,然而手抖把minval和maxval都写成了-0.1,就导致网络权值初始化全部为-0.1,然后不知为啥梯度就一直是0.

改了之后梯度正常出现。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值