95、神经网络在控制与实际应用中的探索

神经网络在控制与实际应用中的探索

1. 离线训练与飞行认证

离线训练在航空领域有着重要作用,它不仅简化了飞行认证流程,这一严格的测试过程旨在确保新飞机及其控制器足够可靠,能够投入日常使用,毕竟这关乎人类生命安全。NASA Ames的C Jorgensen表示,NASA飞行测试人员已经认证了一个离线训练的神经网络控制器,该控制器最近被用于让液压执行器全部失灵的大型MD - 11飞机安全着陆。

2. Kawato的反馈误差学习

Kawato的反馈误差学习也十分重要,它实际上是将经典反馈控制器与神经网络相结合的一种方法。在形式上,它等同于一种特定的近似动态规划(ADP)设计(DHP),其中评判网络是预先硬连线的。而“无模型”间接设计相对没那么有吸引力,这种设计不使用模型网络或矩阵,而是显式或隐式地使用一种相关矩阵,但它并非真正的无模型,因为相关矩阵(或等效物)只是一种简单的工厂模型形式。

3. 随时间优化的神经网络

随时间优化在神经控制的学术文献中所占比例比克隆或基本跟踪设计要小,但它可能占据了工业中实际运行的神经控制产品的大部分价值。在某些情况下,随时间优化用于最小化跟踪误差和某种成本度量,同时考虑时间上的关联。有理由相信人类大脑本身就是这类设计的一员。

随时间优化主要有两种方法:
- 显式方法 :涉及效用的反向传播,与间接自适应控制类似。控制系统通常由模型(神经或非神经)、效用函数U(X)和动作网络组成。主要区别在于选择动作U(?)以最大化未来时间r ≥ t上U(X(r))的总和。为此,需要在两种反向传播形式中进行选择:
- 时间反向传播(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值