29、数据驱动的容错控制方法

原创于 2025-09-28 05:43:51 发布 · 40 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#数据驱动 #容错控制 #强化学习

智能机器的自我守护专栏收录该内容

29 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据驱动的容错控制方法

1. 系统稳定性评估

系统的稳定性是控制领域的关键指标，不同稳定性的系统具有不同的特性。不稳定系统通常具有无限或较大的闭环增益，其最大奇异值为无穷大或很大，稳定裕度为零或接近零。而高稳定性系统则相反，闭环增益小，最大奇异值小，稳定裕度大。

1.1 基于稳定裕度的闭环鲁棒性指标的数据驱动求解算法

下面是基于稳定裕度求解闭环稳定性指标的数据驱动算法步骤：
1. 确定堆叠数据长度并构建 Hankel 矩阵 ：这是数据预处理的重要步骤，为后续计算做准备。
2. 计算稳定图像表示 (IG) ：可以使用基于模型的方法或数据驱动的识别方法。
3. 计算稳定核表示 (KK) ：同样可以采用基于模型的方法或数据驱动的识别方法。
4. 基于公式 (A.12) 计算闭环鲁棒性指标 ：具体公式的详细内容可参考相关资料。

在实际应用中，为了满足实时性要求，最好采用稳定性程度的递归计算。

2. 基于强化学习 (RL) 的 Youla 参数化矩阵求解

在机器人系统的控制环设计中，状态空间和动作空间通常比决策层大得多，状态和控制信号的有效值是无限的。在这种情况下，表格求解方法不再适用，需要使用函数逼近方法来维护值函数。

2.1 RL 代理的任务

RL 代理的核心任务是从现有数据中学习，并提高其泛化能力，以应对未遇到的状态。一般来说，未确定参数的数量（(\theta) 的维度）远小于系统状态

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。