11、最优跟踪神经控制器:原理、设计与应用

最优跟踪神经控制器:原理、设计与应用

1. 反馈控制器训练基础

反馈控制器的训练在成本函数的平均下降值对于任意参考输出和初始条件收敛到一个较小值时结束。由于训练算法本质上是一种梯度下降法,因此可能会遇到局部最小值问题。不过,这个问题可以通过以下方式避免:
- 从不同的初始权重参数开始训练。
- 改变反馈控制器中的节点数量。

2. 倒立摆控制
2.1 问题描述

倒立摆问题是神经网络应用中广泛使用的典型控制问题。该问题涉及平衡一个铰接在小车上的杆子,如图8所示。此问题之所以受到关注,是因为它描述了一个本质上不稳定的系统,并且代表了在广泛操作区域内具有严重非线性的一类问题。以往的控制问题局限于将杆子保持在垂直位置,而这里的控制目标是将杆子保持在任意角度,同时最小化一个一般的二次成本函数。假设小车可以在任一方向无限移动。

最优跟踪神经控制器(OTNC)通过所提出的方法构建和训练,以满足以下控制目标:
1. 将摆锤设置到任意给定的参考角度。
2. 在跟踪参考角度的同时最小化二次成本函数。

植物动力学的非线性微分方程为:
[
\begin{cases}
(M + m)s + mL \cos(\theta)\theta’’ - mL \sin(\theta)\theta^2 = u \
m\ell \cos(\theta) + m\ell\theta’’ = mg \sin(\theta)
\end{cases}
]
当角度偏离零时,动力学具有严重的非线性,此时用任何传统方法解决控制问题都很困难。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值