29、离散时间调优的神经网络控制详解

离散时间调优的神经网络控制详解

1. 离散时间神经网络控制概述

离散时间神经网络控制在处理非线性系统时具有独特优势。离散化非线性系统并提供稳定性证明极为困难,但这里推导的神经网络控制器无需对非线性系统动力学的先验知识,也不需要初始学习阶段。

1.1 非线性系统描述

考虑由以下式子描述的非线性系统:
设 (X_1 = [x_1, x_2]^T),(X_2 = [x_3, x_4]^T),(U = [u_1, u_2]^T),非线性函数 (F(X_1, X_2) = [M(X_1)]^{-1}G(X_1, X_2)),其中:
(G(X_1, X_2) =
\begin{bmatrix}
-b_2a_1a_2(2x_3x_4 + x_1^2)\sin(x_2) + 9.8(b_1 + b_2)a_1\cos(x_1) + 9.8b_2a_2\cos(x_1 + x_2) \
b_2a_1a_2x_1\sin(x_2) + 9.8b_2a_2\cos(x_1 + x_2)
\end{bmatrix})
参数选取为 (a_1 = a_2 = 1),(b_1 = b_2 = 1)。轴 1 和轴 2 分别预先选择期望的正弦输入 (\sin(2\pi t)) 和余弦输入 (\cos(2\pi t))。PD 控制器的连续时间增益选择为 (k_v = diag(20, 20)),(A = diag(5, 5)),采样间隔为 10ms。选择具有 25 个隐藏层节点的单层神经网络,隐藏层所有节点采用 S 型激活函数。(X_1) 的初始条件选择为 ([0.5, 0.1]^T),权重初始化为零,初始不进行离线学习。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值