
RL
不一样的烟火___
我就是我,不一样的烟火(๑• . •๑)
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
什么是Sparse Reward
agent学习的过程中,常常无法及时获得回报。就像家长让小朋友写作业,小朋友可能觉得这个是负面的反馈而不去写作业(做作业让我觉得很痛苦qwq),而没有意识到以后会获得的巨大回报:写完作业后成绩提高,考上好大学,成为高富帅,从此走向巅峰赢取白富美...这个一开始的暂时的小的reward 就叫 Sparse Reward如何让agent在Sparse Reward 中拥有更好的学习表现?...原创 2019-07-18 14:10:19 · 1562 阅读 · 0 评论 -
配置Deepmind_lab环境 ubuntu18.4
一、安装 Bazel1、安装相关的包sudo apt-get install pkg-config zip g++ zlib1g-dev unzip python32、下载bazel-<version>-installer-linux-x86_64.sh: https://github.com/bazelbuild/b...原创 2019-07-23 12:27:16 · 1081 阅读 · 6 评论