89、微分模型与基于采样的微分约束规划

微分模型与基于采样的微分约束规划

1. 微分模型相关理论

在微分模型中,有重要的哈密顿方程。由相关推导可得:
[dH = \sum_{i=1}^{n} \dot{q} i dp_i - \sum {i=1}^{n} \dot{p}_i dq_i]
将其与另一个式子联立,能得到 2n 个方程,即哈密顿方程:
[\dot{q}_i = \frac{\partial H}{\partial p_i}]
[\dot{p}_i = \frac{\partial H}{\partial q_i}]
这里的 (i) 取值从 1 到 (n)。哈密顿方程与欧拉 - 拉格朗日方程等价,不过拉格朗日公式使用 ((q, \dot{q})),而哈密顿使用 ((p, q)),并且哈密顿方程会得到一阶偏微分方程。当假设动力学是时不变的,且运动发生在保守场中时,(dH = 0),这对应着总能量守恒。在时变情况下,会出现额外的方程 (\frac{\partial H}{\partial t} = -\frac{\partial L}{\partial t}) 与哈密顿方程一起。

哈密顿方程主要用于建立理论力学的基本结果,而非确定特定系统的运动。例如,哈密顿量用于建立刘维尔定理,该定理表明相流保持体积,这意味着哈密顿系统不能渐近稳定。

2. 多决策者的微分模型

微分模型可以扩展以模拟多个决策者的相互作用,这会引出连续时间的序贯决策和序贯博弈的扩展。

2.1 微分决策

为了将一个博弈扩展到连续时间,假设自然动作 (\theta(t)) 从集合 (\varTheta) 中选择,可定

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值