95、神经网络在控制与实际应用中的探索

最新推荐文章于 2025-12-06 16:28:30 发布

perl8

最新推荐文章于 2025-12-06 16:28:30 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏：神经计算：智能的基石文章标签：神经网络控制离线训练

本文链接：https://blog.youkuaiyun.com/perl8/article/details/154889025

神经计算：智能的基石专栏收录该内容

99 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

神经网络在控制与实际应用中的探索

1. 离线训练与飞行认证

离线训练在航空领域有着重要作用，它不仅简化了飞行认证流程，这一严格的测试过程旨在确保新飞机及其控制器足够可靠，能够投入日常使用，毕竟这关乎人类生命安全。NASA Ames的C Jorgensen表示，NASA飞行测试人员已经认证了一个离线训练的神经网络控制器，该控制器最近被用于让液压执行器全部失灵的大型MD - 11飞机安全着陆。

2. Kawato的反馈误差学习

Kawato的反馈误差学习也十分重要，它实际上是将经典反馈控制器与神经网络相结合的一种方法。在形式上，它等同于一种特定的近似动态规划（ADP）设计（DHP），其中评判网络是预先硬连线的。而“无模型”间接设计相对没那么有吸引力，这种设计不使用模型网络或矩阵，而是显式或隐式地使用一种相关矩阵，但它并非真正的无模型，因为相关矩阵（或等效物）只是一种简单的工厂模型形式。

3. 随时间优化的神经网络

随时间优化在神经控制的学术文献中所占比例比克隆或基本跟踪设计要小，但它可能占据了工业中实际运行的神经控制产品的大部分价值。在某些情况下，随时间优化用于最小化跟踪误差和某种成本度量，同时考虑时间上的关联。有理由相信人类大脑本身就是这类设计的一员。

随时间优化主要有两种方法：
- 显式方法 ：涉及效用的反向传播，与间接自适应控制类似。控制系统通常由模型（神经或非神经）、效用函数U(X)和动作网络组成。主要区别在于选择动作U(?)以最大化未来时间r ≥ t上U(X(r))的总和。为此，需要在两种反向传播形式中进行选择：
- 时间反向传播（