慕课网《Tensorflow2.0入门到进阶》课程代码无法收敛问题的解决方案

在使用B站慕课网的《Tensorflow2.0入门到进阶》课程进行学习时,遇到了训练无法收敛的问题,经过排查发现,从TensorFlow2.0.0alpha升级后的版本中,SGD的学习率调整导致了这一问题。本文详细记录了解决过程及如何在新版本中配置SGD。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

近日,B站学习慕课网的课程《Tensorflow2.0入门到进阶》,遇到一个问题,训练无法收敛,loss要不是变成nan,要不就越来越大。
错误图片比较了一下版本,课程中用的是tensorflow2.0.0alpha,我用的是2.1.0,然后,我换成了2.0.0,结果,还是不行,最后,只能换成2.0.0alpha,结果,真的可以。
于是,比较了一下,SGD代码的默认实现,居然是这样的:
TensorFlow2.1.0的SGD默认配置
TensorFlow2.0.0alpha的SGD默认配置
原来,TensorFlow2.0.0alpha中SGD的learning rate是0.001,到了2.0.0以及以后的2.1.0版本,改成了0.01,变得没那么容易的收敛了。

如果,要跑课程中的例子,又想用最新的版本的话,可以直接配置一下SGD,如下:
修改后的运行结果

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值