
强化学习方法
文章平均质量分 92
小王爱学习1234
我爱学习,学习爱我
展开
-
论文研读笔记(四)——通过分布式深度强化学习从具有挑战性的环境中学习人群感知机器人导航
在本文中主要贡献有,设计新的奖励函数,提出模拟行人的策略,引入一种碰撞检测学习内容:提示:这里可以添加要学的内容例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、 掌握循环语句学习时间:提示:这里可以添加计划学习的时间例如:1、 周一至周五晚上 7 点—晚上9点2、 周六上午 9 点-上午 11 点3、 周日下午 3 点-下午 6 点学习产出:提示:这里统计学习计划的总量例如:1、 技术笔记 2 遍2、优快云 技术博客 3 篇原创 2022-09-02 15:17:46 · 1008 阅读 · 0 评论 -
论文研读笔记(五)——通过单机器人进化策略搜索增强多机器人导航的深度强化学习方法
解决非平稳性的多智能体合作,结合EPS增强机器人的探索以及提高样本效率,使用DRL训练机器人策略,并利用进化算法优化策略空间,最后将策略参数交叉注入多机器人设置以提高性能和采样效率。...原创 2022-08-30 13:27:51 · 1659 阅读 · 1 评论 -
论文研读笔记(三)——基于障碍函数的移动机器人编队控制安全强化学习
提出一种基于障碍函数的安全强化学习算法,用于状态约束下的非线性多机器人系统DMPC。所提出的方法由几个基于本地学习的 MPC 监管机构组成。每个与本地系统相关联的调节器都使用安全的强化学习算法以分布式方式学习和部署本地控制策略,即仅在相邻代理之间使用状态信息。作为所提出算法的一个突出特点,文中提出了一种新颖的基于障碍的策略结构来确保安全,该结构具有清晰的机制解释。...原创 2022-08-29 13:38:27 · 3520 阅读 · 2 评论