
强化学习
huitailangyz
这个作者很懒,什么都没留下…
展开
-
【论文阅读】Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motiv
【2016NIPS】 任务:层次强化学习 本文提出了层次强化学习,顶层使用价值函数让策略模型学习到内在目标,底层则决定具体的动作,从而来满足顶层提出的给定目标 内在目标可以提供更多的探索,从而缓解稀疏反馈的问题,目标定义在entity和相互之间关系的空间中,可以限制探索空间,提高学习效率 模型 整体结构 由两阶段的层次化结构组成 顶层meta-controller输入为状态sts_tst,输出为目标gtg_tgt 下层controller的输入为gtg_tgt和sts_tst,输出为动作ata_t原创 2020-08-15 19:42:26 · 1046 阅读 · 3 评论 -
【论文阅读】Reinforcement Learning with Competitive Ensembles of Information-Constrained Primitives
【2020ICLR】 Goyal, Anirudh, Shagun Sodhani, Jonathan Binas, Xue Bin Peng, Sergey Levine, and Yoshua Bengio. “Reinforcement learning with competitive ensembles of information-constrained primitives.” arXiv preprint arXiv:1906.10667 (2019). 任务:强化学习的迁移学习 本文提出的原创 2020-07-31 20:54:47 · 479 阅读 · 0 评论 -
【论文阅读】Discovering Reinforcement Learning Algorithms
【2020.7 arxiv】 Oh, Junhyuk, Matteo Hessel, Wojciech M. Czarnecki, Zhongwen Xu, Hado van Hasselt, Satinder Singh, and David Silver. “Discovering Reinforcement Learning Algorithms.” arXiv preprint arXiv:2007.08794 (2020). 任务:使用meta-learning方法学习通用的强化学习算法 解决自动原创 2020-07-31 20:47:12 · 522 阅读 · 0 评论