【论文笔记】Predictive control of aerial swarms in cluttered environments

研究对比了基于势场的无人机群模型与非线性模型预测控制(NMPC)模型在复杂环境中的性能。NMPC模型在保持群体一致性、速度和安全性方面表现出优越性,尤其在处理障碍物和适应不同环境条件时。实验证明,NMPC模型能够实现更快的任务完成时间,更有序的飞行,并且对障碍物密度和速度变化具有更好的可扩展性。

【刊物】 nature子刊:machine intelligence

【年份】2020

本文重点研究swarm,提出一种NMPC模型来描述集群,比PF模型具有更好的集群指标,类似于vicsek的那篇science robotics文章。

摘要:经典的空中蜂群模型通常将全球协同运动描述为发生在个体水平上的局部相互作用的组合。从数学上讲,这些相互作用用势场表示。尽管这些模型的解释很成功,但当空中机器人群应用于在现实世界的混乱环境中飞行的时,它们并不能保证快速和安全的集群运动。此外,这些模型需要与部署场景紧密耦合,以诱导一致的群体行为。在这里,我们提出了一个预测模型,该模型将势场模型的局部原则合并到一个目标函数中,并在agent的动力学和环境的知识下优化这些原则。结果表明,该方法提高了群的速度、order和安全性,与环境布局无关,在群速度和agent间距离上具有可扩展性。我们的模型由五个四旋翼验证,它们可以在充满障碍物的真实室内环境中成功导航。

1.引言和相关工作

        从椋鸟群流畅的波浪状运动到蜂群快速的转弯动作,大自然展示了许多协调飞行的例子。空中机器人技术的最新进展导致了智能无人机以智能手机[8]的价格出现,但部署能够自动协调其本地轨迹的无人机群仍然是一个挑战。无人机群可以提供比单个无人机更大的区域覆盖范围,用于监测和探索任务[9、10],它们可以通过配置一系列不同的传感器[11]来收集多种传感器数据。自动空中蜂群还可以实现单无人机无法实现的功能,如大型物体的协同运输和空中施工[12,13]。Intel[14]、EHang[15]和Verity Studios[16]等公司已经在空中灯光秀中部署了数百架无人机,但在这种情况下,每架无人机都由中央计算机单独控制,以遵循预先计算的轨迹。相反,生物群的协调、同步运动是一种自组织行为,来自局部信息[4-6]、[17-19],因此可以应对不可预见的情况,如穿越森林或城市环境。

        早期的工作表明,生物群的集体运动可以通过同步施加到所有agent上的三个行为规则的组合来描述[20]。这些规则包括: (1) 内聚力,使每个agent更接近其邻居; (2) 排斥,使每个agent远离其邻居以避免冲突; (3) 对齐,使每个agent朝向其邻居的平均航向。在有目标导向的飞行中,对齐规则被迁移规则替代,指引每个agent的方向[21、22]。为了在有障碍物的环境中导航,需要增加第四条规则,即碰撞避免,以引导agent绕开obstacles[20、23、24]。尽管这些规则是在本地定义的,也就是说,每一个agent都针对一组有限的邻居agent来调节其飞行,但事实证明它们产生了全局协同的运动。在数学上,这些规则可以由agent施加在它们的邻居上的虚拟力来建模,并且与势场 (PFs) 相关联,即描述力如何在空间中的不同位置处作用的向量场。

        PFS编码群体的期望行为。它们以与弹簧-质量系统类似的方式调节邻居个体之间的机间距离,速度,使agent朝向共同方向并调节agent与obstacles的距离[23]。

        PF swarm模型的优点是它们纯粹是被动的,这意味着它们的决策完全基于当前的感知信息,因此计算复杂度较低[20,23]。因此,PF模型便于在真实的机器人系统上实现,无论是在自由环境[21、25]具有凸障碍[24]的环境中。在后一种情况下,可以通过定义沿障碍物边界的虚拟排斥agent(称为shill-agent)来避免碰撞。然而,当蜂群接近障碍时,这些shill-agent带来了减慢蜂群速度的缺点[20,26]。这种效应在障碍物密度高的环境中变得显著,在这些环境中,PF蜂群会显著减速。这种减速可以通过削弱排斥力来减弱,尽管这是以牺牲群体安全为代价的,因为一些agent可能会发生碰撞。此外,考虑到现实世界的特殊性,这些模型通常包含大量具有复杂相互依赖关系的参数[2,24]。因此,它们通常需要采用优化技术,如进化算法,以确定参数的可行实例化,每个实例化都特定于集群的首选速度和agent间距离,以及环境布局[21、24、27]。

        本文提出了一种基于预测控制的群集控制方法。具体地说,在保证在杂乱环境中安全导航的同时,预测控制的航群显示更快的飞行,能够适应不同的障碍物密度,并且可以扩展到智能体间距离和群速度的变化。最近,有人主张,某种形式的预测控制,以它们共同行为的内部模型的形式,也可以被生物群所利用,在生物群中,诸如一群八哥或一群鱼等协调动作的明显同步不能用纯生物反应系统来解释。在这一假设的启发下,本文提出了一种基于非线性模型预测控制(NMPC)的群体行为模型

        模型预测控制(MPC)是计算系统的控制动作作为约束优化问题[28,29]的解决方案。 MPC利用系统的数学表示来预测和优化其在迭代过程中的未来行为。与PF控制不同,MPC可以明确地处理诸如物理限制的约束(例如,无人机的飞行速度和加速度)[30-32]和环境限制(例如,无飞行区域)[​​32-34]。然而,受限优化问题的迭代在线解决方案与更高的计算成本相关,因此机器人中的预测控制器的仅采用了最近的[35]。

        MPC在多机系统仿真中显示了良好的效果。实例包括在无障碍物环境[36-37]中、在存在obstacles[33]的情况下以及在已知目标位置[38–40]的为情况下多机系统生成无碰撞轨迹中。NMPC是MPC的一种变体,可以处理系统和其约束的非线性[29]。这种优势是以更高的计算要求为代价的。在仿真中,在无障碍情况下利用NMPC控制leader-follower编队,在凸障碍34的情况下控制二维四旋翼编队。

        在使用多台真实无人机的MPC方面所做的工作较少,这主要是由于实时实验的困难。在leader-follower配置中,线性MPC能被用于在存在虚拟障碍物的情况下进行轨迹规划,其中无人机(follower者)必须与虚拟agent(leader)保持恒定的距离[42]。然而,在leader-follower方法中,领导者具有群体轨迹的额外知识,这是预先编程的或由外部来源提供的。此方面引入了agent角色的不平等性,并在swarm中添加了单点故障的可能性。MPC用于在具有障碍物的环境中在线生成一组无人机的无碰撞轨迹,其中每个无人机被单独分配初始位置和目标位置[32]。相反,本文提出的模型旨在将群体导航作为一个独特的实体进行协调,并保证内部秩序,而不是单独生成轨迹。同时,我们避免了对群体施加刚性的编队或固定的拓扑结构,这可能会影响个体运动的自由和流动性。最后,在实际的多无人机系统中, NMPC能够处理非凸避碰约束,当Agent被分配相交路径时,尽管它们在空环境中飞行[44]。

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值