
论文翻译
文章平均质量分 94
PilviMannis
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SEED RL:SCALABLE AND EFFICIENT DEEP-RL WITH ACCELERATED CENTRAL INFERENCE 翻译
SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference,该论文是谷歌2020年提出的IMPALA中Actor用CPU,Learner使用GPU存在的缺点:1、Actor前推在CPU,计算效率较低,当模型较大时,推理时间会延长,若是通过增加Actor的数量,则会增加成本,同时也将影响模型的收敛速度。2、资源的利用率较低,Actor需要在两个任务(环境step和网络推理)之间进行切换,而两个人物之间的计算需求是.翻译 2021-02-24 15:22:38 · 722 阅读 · 0 评论 -
腾讯星际争霸 TStarBots1解读
3.1 Our PySC2 Extension(PySC2扩展)SC2LE [16]是DeepMind和Blizzard联合提出的平台。 暴雪提供的游戏核心库提供了原始界面和功能映射界面。 DeepMind PySC2环境进一步将核心库包装在Python中,并完全公开了功能图界面。 目的是紧密模拟人为控制(例如,鼠标单击某处或按下某些键盘按钮),由于SC2内部结构的复杂性,它会导致大量操作。 因此,这给决策系统带来了不小的困难。 而且,这样的“玩家级”建模对于“单位级”建模是不便的...原创 2020-07-22 14:49:34 · 2165 阅读 · 0 评论 -
《Towards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning》译文
原文链接https://arxiv.org/pdf/1709.10082v1.pdfTowards Optimally Decentralized Multi-Robot Collision Avoidance via Deep Reinforcement Learning原文:Abstract— Developing a safe and efficient collisio...原创 2020-04-09 19:19:24 · 2386 阅读 · 0 评论