用于牵引车 - 挂车倒车路径跟踪的进化神经网络控制器
1. 引言
神经进化是指利用进化算法来创建和/或训练神经网络。在本文中,使用遗传算法调整固定大小神经网络的权重,以最大化奖励函数。这一概念属于强化学习范畴,通常在缺乏训练数据但有模拟环境的情况下使用。
早期的神经进化工作大多围绕固定大小的神经网络展开,后来出现了神经网络拓扑结构进化(NEAT)技术,它能同时进化神经网络的权重和拓扑结构。本文出于简化考虑使用固定大小的网络,但读者应了解NEAT,因为它除了优化权重外,还能优化网络拓扑。仅对权重进行优化本身也具有重要价值,是了解神经进化的良好开端。
神经进化控制利用神经进化创建神经网络控制器。牵引车 - 挂车倒车是一项具有挑战性的控制任务,神经进化控制非常适合解决此类问题。因为这种系统本质上是不稳定、非线性和非完整的,而神经网络作为通用函数逼近器,能够处理极端非线性情况。
创建用于牵引车 - 挂车倒车路径跟踪的神经网络控制器是强化学习技术的一个合适应用场景,因为没有精确的输入/输出对作为训练数据,无法通过解析方法计算出牵引车的理想转向角。在强化学习领域,神经进化已成为开发牵引车 - 挂车倒车控制器的常用技术。
本文所提出的牵引车 - 挂车倒车控制器是对以往工作的扩展。主要目标是展示开发神经进化控制器的方法,这些技术可应用于多种控制问题。接下来将介绍神经进化控制器的开发过程,包括神经网络和遗传算法的背景信息,然后通过牵引车 - 挂车的示例详细说明系统模型、控制器设计和性能。
2. 神经进化控制器开发
神经进化控制器与大多数其他控制器类似,利用可用信息生成控制信号。对于前馈神经网络,训练后的控制器可视为
超级会员免费看
订阅专栏 解锁全文
844

被折叠的 条评论
为什么被折叠?



