最优跟踪神经控制器:原理、设计与应用
1. 反馈控制器训练基础
反馈控制器的训练在成本函数的平均下降值对于任意参考输出和初始条件收敛到一个较小值时结束。由于训练算法本质上是一种梯度下降法,因此可能会遇到局部最小值问题。不过,这个问题可以通过以下方式避免:
- 从不同的初始权重参数开始训练。
- 改变反馈控制器中的节点数量。
2. 倒立摆控制
2.1 问题描述
倒立摆问题是神经网络应用中广泛使用的典型控制问题。该问题涉及平衡一个铰接在小车上的杆子,如图8所示。此问题之所以受到关注,是因为它描述了一个本质上不稳定的系统,并且代表了在广泛操作区域内具有严重非线性的一类问题。以往的控制问题局限于将杆子保持在垂直位置,而这里的控制目标是将杆子保持在任意角度,同时最小化一个一般的二次成本函数。假设小车可以在任一方向无限移动。
最优跟踪神经控制器(OTNC)通过所提出的方法构建和训练,以满足以下控制目标:
1. 将摆锤设置到任意给定的参考角度。
2. 在跟踪参考角度的同时最小化二次成本函数。
植物动力学的非线性微分方程为:
[
\begin{cases}
(M + m)s + mL \cos(\theta)\theta’’ - mL \sin(\theta)\theta^2 = u \
m\ell \cos(\theta) + m\ell\theta’’ = mg \sin(\theta)
\end{cases}
]
当角度偏离零时,动力学具有严重的非线性,此时用任何传统方法解决控制问题都很困难。
超级会员免费看
订阅专栏 解锁全文
1628

被折叠的 条评论
为什么被折叠?



