基于强化学习的自主直升机飞行
引言
直升机飞行是极具挑战性的控制问题。传统手动设计程序虽能为简单机动(如悬停)获取控制器,但过程繁琐,即便经验丰富的控制工程师也需耗费大量时间进行调整和飞行测试。对于复杂机动,如特技飞行,传统方法可能不可行。而强化学习(RL)算法为控制器设计提供了更快速、自动化的途径,在自主直升机飞行领域取得了显著成果。
动机与背景
自主直升机飞行是一个极具挑战性的控制问题,相比固定翼飞机控制难度大很多。不过,直升机具备独特能力,如原地悬停、垂直起降和低速机动,使其在许多实际应用中成为重要的研究课题。
手动构建直升机自主飞行控制器并非易事,需要专家凭借丰富的直升机动力学知识进行长时间的调试。而RL方法在直升机控制器的自动化开发方面取得了巨大成功,不仅在基本飞行机动(如悬停和前飞)中达到了先进水平,还是实现高级特技飞行的有效方法之一。通过“学徒学习”,算法可以通过观察人类演示者来学习,使自主直升机能够完成特技飞行,甚至表现得比人类专家飞行员更好。
开发直升机自主飞行控制器面临诸多挑战:
1. 动力学复杂 :直升机具有不稳定、高维、不对称、嘈杂、非线性和非最小相位的动力学特性,成功的控制器通常有很多参数,手动调整这些参数既困难又耗时,且不稳定的动力学特性使飞行测试变得复杂。
2. 欠驱动系统 :直升机的位置和方向需要六个参数来表示,但只有四个控制输入,这就需要在方向误差和期望位置误差之间进行权衡和规划。
3. 动力学难以建模 :直升机的真实动力学非常复杂,精确的模拟器难以创建,在模拟
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



