自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

rl小透明

Enoch Liu98 优快云认证博客专家优快云认证企业博客

码龄7年

62: 原创

30万+: 周排名

16万+: 总排名

14万+: 访问

: 等级

1300: 积分

85: 粉丝

193: 获赞

44: 评论

850: 收藏

私信

关注

热门文章

分类专栏

机器学习 18篇
推荐系统 1篇
C++ 4篇
运筹优化 1篇
tensorflow 4篇
pytorch 4篇
RL 18篇
CV 1篇
深度学习部署 3篇
LeetCode 5篇
python 4篇
linux 5篇
概率论 1篇
推免经历 1篇
其他 4篇
人脸识别 4篇
ml 6篇
模糊逻辑 1篇
智能交通灯系统 1篇
LCS 1篇
竞赛 2篇
NLP 1篇

最新评论

如何判断强化学习算法是否收敛
Wen_zia: 博主，你提到的最优轨迹这个例子正好就是我现在要用的，一条轨迹的单步平均奖励是直接将reward全换成这个吗？包括输入给critic网络的？因为我用的PPO，更新网络用的是折扣奖励，应该是要都换了吧？
如何判断强化学习算法是否收敛
DUANDUAN317: 你好，请问这个问题解决了吗？我也遇到了
多智能体强化学习
￥YRQ￥: 这是哪本书啊
深度强化学习训练调参方法
EDEN_RT: 感谢作者受益匪浅！博主有什么推荐的强化学习入门教程？
如何判断强化学习算法是否收敛
2401_83896807: 您好，请问您解决了这个问题了吗

RL

关注

文章平均质量分 70

关注数：文章数：18 文章阅读量：84389 文章收藏量：575

作者: Enoch Liu98

这个作者很懒，什么都没留下…

展开