- 博客(46)
- 收藏
- 关注
原创 论文研读笔记(四)——通过分布式深度强化学习从具有挑战性的环境中学习人群感知机器人导航
在本文中主要贡献有,设计新的奖励函数,提出模拟行人的策略,引入一种碰撞检测学习内容:提示:这里可以添加要学的内容例如:1、 搭建 Java 开发环境2、 掌握 Java 基本语法3、 掌握条件语句4、 掌握循环语句学习时间:提示:这里可以添加计划学习的时间例如:1、 周一至周五晚上 7 点—晚上9点2、 周六上午 9 点-上午 11 点3、 周日下午 3 点-下午 6 点学习产出:提示:这里统计学习计划的总量例如:1、 技术笔记 2 遍2、优快云 技术博客 3 篇
2022-09-02 15:17:46
999
原创 Git及其使用
Git 是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小或大的项目。Git使用 C 语言编写。 GIT 很快,C 语言通过减少运行时的开销来做到这一点
2022-08-31 22:46:03
267
1
原创 算法设计——排序与查找面试题
排序算法是《数据结构与算法》中最基本的算法之一。 排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。常见排序算法有:插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。......
2022-08-31 22:03:09
368
原创 前端总结——Webpack及其用法
Webpack可以看做是模块打包机:它做的事情是,分析项目结构,找到JavaScript模块以及其它的一些浏览器不能直接运行的拓展语言(Scss,TypeScript等),并将其打包为合适的格式以供浏览器使用
2022-08-31 21:32:53
480
原创 论文研读笔记(五)——通过单机器人进化策略搜索增强多机器人导航的深度强化学习方法
解决非平稳性的多智能体合作,结合EPS增强机器人的探索以及提高样本效率,使用DRL训练机器人策略,并利用进化算法优化策略空间,最后将策略参数交叉注入多机器人设置以提高性能和采样效率。...
2022-08-30 13:27:51
1649
1
原创 windows11系统 “任务管理器已被管理员禁用”怎么解决
我们日常查看系统当前运行的程序和相关的任务进程,需要用到任务管理器。虽然我们很长时间可能都不会用一次,但是你不能没有。出现“任务管理器已经被管理员禁用”的情况,作为电脑管理员的我们都不知情,那就说不过去了,必须出手格局一下了。......
2022-08-30 09:23:30
27721
10
原创 论文研读笔记(三)——基于障碍函数的移动机器人编队控制安全强化学习
提出一种基于障碍函数的安全强化学习算法,用于状态约束下的非线性多机器人系统DMPC。所提出的方法由几个基于本地学习的 MPC 监管机构组成。每个与本地系统相关联的调节器都使用安全的强化学习算法以分布式方式学习和部署本地控制策略,即仅在相邻代理之间使用状态信息。作为所提出算法的一个突出特点,文中提出了一种新颖的基于障碍的策略结构来确保安全,该结构具有清晰的机制解释。...
2022-08-29 13:38:27
3482
2
原创 论文研读笔记(二)——通过深度强化学习避免碰撞的编队控制
通过学习一项综合任务将基于学习的策略扩展到编队控制领域。特别是采用了模仿学习和强化学习的两阶段训练方案。提出了一种融合奖励函数来引导训练。此外,提出了一种面向编队的网络架构用于环境感知,并应用长短期记忆(LSTM)来感知任意数量的障碍物的信息。进行了各种模拟,结果表明所提出的算法能够预测环境的动态信息,并且优于传统方法。...
2022-08-28 13:19:19
5057
6
原创 论文研读笔记(一)——多智能体强化学习的相对分布编队和避障
尽管模型预测控制 (MPC) 和模糊控制等一些经典控制器取得了一定程度的成功,但它们中的大多数都需要在恶劣环境中无法获得的精确全局信息。另一方面,一些基于强化学习(RL)的方法采用领导者-跟随者结构来组织不同代理的行为,这牺牲了代理之间的协作,从而在可操作性和鲁棒性方面遇到瓶颈。在本文中,我们提出了一种基于多智能体强化学习(MARL)的分布式编队和避障方法。我们系统中的代理仅利用本地和相关信息来做出决策并分布式控制自己。......
2022-08-27 12:46:25
5790
5
原创 连续动作的强化学习算法——SAC
Soft Actor-Critic 目前来说,关于连续动作的强化学习算法,经常使用到的就是PPO、DDPG和SAC以及在此基础上的改进算法,这里主要说一下SAC算法。介绍 首先SAC算法是基于Off-Policy的,因此会用到Replay Buffer,使用过去的样本经验进行学习,这会使得算法的稳定性和收敛性有一定的困难,特别是在连续的状态和动作空间下。然后是基于Actor-Critic的,同时基于值和策略进行评估,可以实现单步更新。SAC则是在此基础上,要求最大化期望的同时最大化策略分布的熵,以
2022-05-10 20:20:54
5886
原创 从零搭建一个机器人仿真的平台
搭建ROS(机器人操作系统)和ROS2ROS2可以在macOS、Windows、Linux、Debian和Ubuntu上安装,参考教程:ROS2的安装ROS只可以安装在Ubuntu系统之上,从零开始需以下几步:安装vmware虚拟机、在虚拟机上安装Ubuntu系统、根据Ubuntu的版本安装对应的ROS、最后测试系统是否安装成功。当然也可以装一个双系统的Ubuntu,此系统下可支持GPU,训练神经网络可用GPU加速。如需安装参考:https://blog.youkuaiyun.com/dcrmg/article/
2021-11-19 19:50:16
1824
原创 论文研读——n个物体相互间的碰撞避免
论文研读——Reciprocaln-body Collision Avoidance此篇文章为论文的学习笔记,只供学习使用,不作商业用途,侵权删除。并且本人学术功底有限,如有思路不正确的地方欢迎批评指正!摘要在本文中,我们提出了一种形式化的n个物体相互避碰方法,其中多个移动机器人在一个共同的工作空间中移动时需要避免彼此碰撞。在我们的公式中,每个机器人完全独立行动,不与其他机器人通信。在速度障碍定义的基础上,通过将问题简化为求解一个低维线性规划,得到了无碰撞运动的充分条件。我们在几个密集而复杂的模拟场景
2021-11-15 18:22:53
4814
2
原创 论文研读——基于深度强化学习的自动驾驶汽车运动规划研究综述
论文研读——Survey of Deep Reinforcement Learning for Motion Planning of Autonomous V ehicles摘要除了经典的控制设计方法外,人工智能和机器学习方法几乎都存在于这些领域。另一部分研究集中在运动规划的不同层面,如战略决策、轨迹规划和控制。机器学习本身已经开发了广泛的技术,本文将介绍其中的一个领域——深度强化学习(Deep Reinforcement Learning, DRL)。本文深入了解了分层运动规划问题,并描述了DRL的基
2021-11-15 14:35:10
7069
1
原创 论文研读——机器人导航深度局部轨迹重规划与控制
论文研读——Deep Local Trajectory Replanning and Control for Robot Navigation此篇文章为论文的学习笔记,只供学习使用,不作商业用途,侵权删除。并且本人学术功底有限,如有思路不正确的地方欢迎批评指正!摘要文中提出了一个结合分层规划和机器学习思想的导航系统。该系统使用传统的全局规划器来计算到达目标的最优路径,并使用深度局部轨迹规划器和速度控制器来计算运动命令。系统的后一个组件通过注意机制调整机器人的行为,使其向目标移动,避免障碍,并尊重附近行
2021-11-14 21:03:05
1647
原创 深度学习传感器融合技术在自动驾驶汽车感知与定位中的应用研究进展
论文研读——Deep Learning Sensor Fusion for AutonomousV ehicle Perception and Localization: A Review深度学习传感器融合技术在自动驾驶汽车感知与定位中的应用研究进展摘要1、介绍2、传感器技术和传感器融合概述2.1 介绍了传统传感器融合方法2.2 介绍了深度学习传感器融合方法3、环境感知:局部动态感知图4、自我定位与映射5、结论和未来的研究建议V ehicle Perception and Localization: A
2021-11-14 20:03:27
3075
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人