Motion Planning Networks
这是一个基于神经网络的路径规划方法
摘要
提出一个叫做MPNet的基于神经网络的路径规划模型,对输入的点云表示的环境进行编码,然后输出一个端到端的可行的路径。作者在2D和3D环境上都进行了测试,也在一个7自由度的机械臂上进行了测试。结果显示这个MPNet不仅计算效率很高,而且泛化能力也很强。结果也显示MPNet在任何环境下生成路径的时间都少于1秒。
介绍
文章说现在一些基于采样的路径规划方法计算效率都很高,譬如RRT*,双向RRT*,P-RRT*,但是在高维度的环境下就变得很慢了。本文就是为了解决这个问题,提出了一个基于深度神经网络的循环运动规划算法MPNet。MPNet主要包括两个部分:编码网络和规划网络(encoder network and planning network)。
encoder network的作用就是把障碍物的点云数据编码成潜在环境表示(为了降维)。planning network的作用就是,你给它t时刻的位置,终点还有上面得到的潜在环境表示之后,它给你输出t+1时刻的位置。
相关工作
基于强化学习的路径规划需要机器人和环境进行大量的交互,这个在实际环境里并不现实,训练起来很麻烦。
最近路径规划领域兴起的是模仿学习(imitation learning),也就是学习基于采样的方法生成的路径。本文用的就是模仿学习。
MPNet细节
MPNet的具体结构如下图:
MPNet是一个两阶段的网络,包括:a)离线网络训练,b)在线路径生成。
A. 离线训练
MPNet用到了两个网络模型,第一个是编码器网络(Enet),用来编码障碍物的点云数据(如图1.a那样)。第二个是planning网(Pnet),这个网络通过上面的点云编码后的数据+起点+终点来进行运动规划(就像图1.b)。
- 编码器网络:Enet把障碍物的点云数据编码到特征空间Z∈ R m R_m Rm,m是一个整数,是为了降维的。Enet就是一个encoder-decoder结构(像Unet那样)。作者发现用压缩自编码器(CAE)的话,可以学到更加鲁棒的不变空间特征,对于路径规划和泛化都有很好的帮助。CAE的损失:
这里 θ e θ^e θe是encoder的参数, θ d θ^d θd是decoder的参数,λ是惩罚系数, D o b s D_{obs} Dobs是障碍物的点云数据集合, x ^ \hat{x} x^是decoder重建后的点云。 - 路径规划网络:路径规划网络是一个前馈神经网络。给定上面编码后的点云数据 Z Z Z,当前位置 x t x_t xt和终点 x T x_T xT,Pnet可以预测下一个位置 x ^ t + 1 \hat{x}_{t+1} x^t+1<