自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Joe的博客

Joe-Han 优快云认证博客专家优快云认证企业博客

码龄12年

50: 原创

13万+: 周排名

64万+: 总排名

91万+: 访问

: 等级

4967: 积分

400: 粉丝

1012: 获赞

113: 评论

1880: 收藏

私信

关注

热门文章

分类专栏

TensorFlow 11篇
深度学习 8篇
Python 7篇
NLP 6篇
写作 1篇
eclipse 2篇
机器学习 12篇
java web 1篇
算法 9篇
LeetCode 7篇
Torch 1篇

最新评论

eclipse下配置Tomcat部署目录
weixin_46078926: 厉害解决问题
强化学习笔记(2)：Sarsa 与 Sarsa(lambda)
ᐒ: 那些大佬的脑子是真的6，到底是怎么想到这些个方法的。。
python实现二叉查找树
#＃H9: 逻辑是错误的，但这句话删了也没影响，del删除的是变量，即解除引用
Numpy数组的保存与读取
whutfan: 不是.npz吗？.npy是什么
强化学习笔记(2)：Sarsa 与 Sarsa(lambda)
footballreg: “另外，Q-Learning因为有了 maxQ，所以也是一个特别勇敢的算法，原因在于它永远都会选择最近的一条通往成功的道路，不管这条路会有多危险。而 Sarsa 则是相当保守，它会选择离危险远远的，这就是使用Sarsa方法的不同之处。” 根本就是想当然的胡扯，请问哪里体现出Sarsa 则是相当保守，它会选择离危险远远的？？？ Sarsa和Q-learning最大的区别就是选择A'时，Q-learning用的是纯贪婪的策略。而Sarsa则有一定几率选择随机策略。

最新文章

机器学习

关注

关注数：文章数：12 文章阅读量：367252 文章收藏量：1695

作者: Joe-Han

这个作者很懒，什么都没留下…

展开