深度增强学习
iroy33
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
[概念] Benchmark算法和baseline算法
链接:https://www.zhihu.com/question/28823373/answer/101504099来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。Benchmark和baseline都有性能比较的意思。先看看字典定义。benchmark:N-COUNT A benchmark is something whose quality or q...转载 2019-11-22 17:07:05 · 2234 阅读 · 0 评论 -
[论文笔记] SIGCOMM 2019 Neural Packet Classification
首先来看看RL深度强化学习—— 译 Deep Reinforcement Learning任何可以被视为或转变为顺序决策问题的问题,RL都可能会有所帮助。原创 2019-11-22 16:48:29 · 1629 阅读 · 0 评论 -
港科大博士生李思毅:深度强化学习——从原理到应用
港科大博士生李思毅:深度强化学习——从原理到应用看都看了,还是要记录一下我得到了什么知识的如果训练数据和测试数据不是独立同分布,那么训练出来的结果不会有好的泛化性能很多问题与环境持续交互,数据有很强相关性,不符合独立agent:最终想要实现的AIenvironment:action:state:reward:来评估当前选取的action的好坏environment接收到actio...转载 2019-11-21 09:11:55 · 761 阅读 · 0 评论
分享