Parallel Control for Optimal Tracking via Adaptive Dynamic Programming

最新推荐文章于 2025-11-12 00:00:00 发布

原创

最新推荐文章于 2025-11-12 00:00:00 发布 · 915 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#学习 #笔记

Parallel Control for Optimal Tracking via Adaptive Dynamic Programming ，2020，Jingwei Lu, Qinglai Wei, Senior Member, IEEE, and Fei-Yue Wang, Fellow, IEEE

对连续非线性系统求解最优平行控制，与现有的最优状态反馈控制不同，最优平行控制的控制输入被引入到反馈系统中。
但由于反馈系统中控制输入的引入，最优状态反馈控制方法不能直接应用，则提出增广系统和增广性能指标函数。状态反馈系统的李雅普诺夫函数 $V_e$ ，增广系统李雅普诺夫函数 $V_p(e,u_e)$ 。
因此一般非线性系统转化为仿射非线性系统，分析最优平行控制和最优反馈控制的不同。ADP方法使用评价网络在线近似值函数。李雅普诺夫理论分析闭环系统稳

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LucienLSA

关注关注

7
点赞
踩
30

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

强化学习与网络安全资源

全网120W+关注AI拉呱，专注人工智能以及科技前沿！

05-21

575

【代码】强化学习与网络安全资源。

强化学习与网络安全资源-论文和环境

全网120W+关注AI拉呱，专注人工智能以及科技前沿！

05-14

469

【代码】强化学习与网络安全资源-论文和环境。

1 条评论您还未登录，请先登录后发表或查看评论

Adaptive dynamic programming_自适应动态规划

weixin_41957433的博客

05-06

1055

本文简要介绍了自适应动态规划技术

Value Iteration Adaptive Dynamic Programming for Optimal Control of Discrete-Time Nonlinear Systems

DarlingLSA的博客

03-17

2115

对离散时间非线性系统，采用值迭代ADP算法，求解无限时域无折扣因子最优控制问题。初始值函数为任意半正定。提出，保证迭代值函数收敛到最优值函数。初始化不同值函数，可证明迭代值函数为单调不增，单调不减或不单调。由于迭代控制策略的可容许性不能仅靠收敛终止判据来保证，因此第一次提出值迭代算法的迭代控制策略的容许性，确定新的终止标准以保证迭代控制策略的有效性。神经网络近似迭代值函数和计算迭代控制策略。

Dynamic Programming and Optimal Control,

12-21

很好的DP资料讲得清楚做acm的可以好好看看

adaptive dynamic programming

05-30

Nowadays, nonlinearity is involved in all walks of life. It is a challenge for engineers to design controllers for all kinds of nonlinear systems. To handle this issue, various nonlinear control theories have been developed, such as theories of adaptive control, optimal control, and robust control. Among these theories, the theory of optimal control has drawn considerable attention over the past several decades. This is mainly because optimal control provides an effective way to design controllers with guaranteed robustness properties as well as capabilities of opti- mization and resource conservation that are important in manufacturing, vehicle emission control, aerospace systems, power systems, chemical engineering pro- cesses, and many other applications.

自适应动态规划（Adaptive Dynamic Programming，ADP）解决动态系统中的最优控制问题--基础入门（附带matlab代码帮助理解）

weixin_45890250的博客

06-05

6759

我们以一个离散时间线性系统为例：其中，是系统状态，是控制输入，A 和 B 分别是系统的状态矩阵和控制矩阵。我们的目标是最小化以下二次型成本函数：其中，Q 和 R 是权重矩阵，确保系统状态和控制输入之间的平衡。

ADP论文学习-最优调节控制问题

DarlingLSA的博客

02-16

1260

有关ADP 的经典文章学习记录

RL算法综述

热门推荐

zincrain的博客

12-09

2万+

Adaptive Dynamic Programming 自适应动态规划

12-28

Adaptive Dynamic Programming 自适应动态规划的入门介绍。令初学者简明扼要的了解ADP的核心思想。

ROBUST ADAPTIVE DYNAMIC PROGRAMMING

03-24

动态规划 by 姜宇Yu Jiang & Zhong-Ping Jiang 小册子

平行控制与数字孪生：经典控制理论的回顾与重铸.docx

05-27

平行控制与数字孪生：经典控制理论的回顾与重铸.docx

Dynamic Programming

孙佰贵的专栏

05-30

1314

Dynamic Programming is an algorithmic paradigm that solves a given complex problem by breaking it into subproblems andstores the results of subproblems to avoid computing the same results again. Follo

Reinforcement Learning and Adaptive Dynamic Programming（强化学习和自适应动态规划）

qq_43435956的博客

06-05

2611

强化学习和自适应动态规划本文主要记录一下控制领域强化学习和自适应动态规划的发展，主要分为如下几个方向展开：以早期Werbos提出Actor-Critic结构的Adaptive Dynamic Programming，并大致分成四类结构，包括DHP、HDP、ADDHP、ADHDP等等，这些算法大多数是通过收集数据进行离线算法。1 以Frank Lewis等人的自适应动态规划，包括On policy、Off policy和新提出的同步策略迭代，连续系统的Integral Reinforcement

基于平行控制的离散非线性系统的事件触发近似最优控制

weixin_70923796的博客

10-14

658

【摘要】针对离散非线性系统提出了一种基于平行控制的事件触发近似最优控制方法。首先，基于时间触发的最优值函数和最优控制律，提出了一种新型的触发条件，并基于李雅普诺夫方法证明了闭环系统的渐近稳定性。其次，为了实施设计的触发条件，提出了一种采用神经网络和自适应动态规划技术的平行控制方法，以预测系统的下一步状态，并获得最优值函数和最优控制律。最后，通过仿真实验验证了所提方法的有效性。【关键词】事件触发控制 ; 非线性最优控制 ; 平行控制 ; 自适应动态规划1.引言在过去的数十年中，随着计算能力的提升，智能控制方

ADP论文学习-最优跟踪控制问题

DarlingLSA的博客

03-01

1373

对初始值函数为0，其值迭代VI算法迭代控制策略使得系统不能保证稳定。Theorem3.1给出在PI算法下，迭代值函数是单调不增的。连续时间和离散时间的策略迭代算法不同，首先HJB方程不同，且连续时间下的分析方法基于微分。，迭代值函数是单调不增，收敛到HJB方程的最优值。当迭代次数趋于无穷时，PI算法收敛，有迭迭代控制策略近似最优控制策略，迭代值函数是单调不增收敛到最优。传统的DP方法会面临维数灾难问题，控制序列是无限的，几乎不可能由HJB方程获得最优控制。获得最优控制策略，必须先获得最优值函数。

【最优控制笔记】——4自适应动态规划1

Piccaboo的博客

12-11

3804

自适应动态规划（Adaptive Dynamic Programming） 1.ADP基础 1）简介 Werbos提出，利用函数近似结构逼近动态规划方程中的性能指标函数和控制策略，以满足最优性原理，从而时间向前(Forward-in-time) 获得最优控制和最优性能指标函数。主要解决无限域最优控制问题（没有终点，即使有也需要运算无数次才能到起点）：无限域最优控制问题的Bellman最优性原理表示为： HJB方程表示为： 2）基本原理自适应动态规划整个结构包括三个部分，整个过程是自学习的。三部

Dynamic Programming~~动态规划

azyxa1的博客

12-04

183

之前面试遇到这个问题然后我忘记了。昨天笔试又遇到才发现原来这么简单，只是我之前遇到然后没有当回事，刚刚搜了一下可太简单了吐了我所遇到的问题是这么问的：假设现在有个100滴血的怪物，你有两个技能，A技能可以让他掉1滴血，B技能可以让他掉2滴血，那么你有多少种方式打死这个怪物呢？没接触过动态规划的人（比如之前的我）真是摸不着头脑，面试官都提示我了这种问题可以分解成为小的问题，比如...

与#pragma omp parallel for schedule(dynamic)区别

10-12

</think>### `#pragma omp parallel for schedule(dynamic, 1)` 与 `#pragma omp parallel for schedule(dynamic)` 的区别详解 #### 1. **核心区别：块大小（chunk size）的定义** - **`schedule(dynamic, 1)`** ...