无人机轨迹学习问题

无人机轨迹学习,路径跟踪方案

个人总结:

1.强化学习:建立一种奖励机制,它最符合人类的学习机制,学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or return)。

2.RBF Neural Networks:RBF神经网络是一种性能优良的前馈型神经网络,RBF网络可以任意精度逼近任意的非线性函数,且具有全局逼近能力. RBF神经网络可以根据具体问题确定相应的网络拓扑结构,具有自学习、自组织、自适应功能,它对非线性连续函数具有一致逼近性,学习速度快,可以进行大范围的数据融合,可以并行高速地处理数据。

对环境进行建模,在网络中分布各个节点,通过碰撞函数分析与碰撞物碰撞的几率,通过距离函数计算到目标点的距离,在两个函数的作用下,无人机趋向于最优路径。因自身具有学习能力,对环境的改变也能够适应;

3.蚁群算法:基于概率的路径规划算法,前期收敛速度慢,容易陷入局部最优点,但对运算要求不高;

4.人工势场法:基本思想是将物理空间的障碍物抽象为斥力场,将目标点抽象为引力场,障碍物排斥无人机防止其碰撞,目标点吸引无人机使其向终点飞行。不需要建立复杂的环境模型,结构简单,运算量比较小,能够实时处理并反馈信息,但这种方法存在陷入局部最小值的情况,无人机在斥力场周围徘徊,找不到目标点的路径;改进算法就是在无人机和目标点的距离作为一个因子,加入到斥力场函数中,使得目标点不论在任何情况下都是全局势场最小的点,这样就能脱离局部最小值的束缚;

Adaptive trajectory tracking neural network control with robust compensator for robot manipulators

提出了一种基于径向基函数(RBF)的自适应轨迹跟踪神经网络控制方法,用于具有鲁棒补偿器的n连杆机器人机械手实现高精度的位置跟踪。为了保证控制系统的稳定性和鲁棒性,由于摩擦力、外部干扰误差和参数变化等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值