微分模型与基于采样的微分约束规划
1. 微分模型相关理论
在微分模型中,有重要的哈密顿方程。由相关推导可得:
[dH = \sum_{i=1}^{n} \dot{q} i dp_i - \sum {i=1}^{n} \dot{p}_i dq_i]
将其与另一个式子联立,能得到 2n 个方程,即哈密顿方程:
[\dot{q}_i = \frac{\partial H}{\partial p_i}]
[\dot{p}_i = \frac{\partial H}{\partial q_i}]
这里的 (i) 取值从 1 到 (n)。哈密顿方程与欧拉 - 拉格朗日方程等价,不过拉格朗日公式使用 ((q, \dot{q})),而哈密顿使用 ((p, q)),并且哈密顿方程会得到一阶偏微分方程。当假设动力学是时不变的,且运动发生在保守场中时,(dH = 0),这对应着总能量守恒。在时变情况下,会出现额外的方程 (\frac{\partial H}{\partial t} = -\frac{\partial L}{\partial t}) 与哈密顿方程一起。
哈密顿方程主要用于建立理论力学的基本结果,而非确定特定系统的运动。例如,哈密顿量用于建立刘维尔定理,该定理表明相流保持体积,这意味着哈密顿系统不能渐近稳定。
2. 多决策者的微分模型
微分模型可以扩展以模拟多个决策者的相互作用,这会引出连续时间的序贯决策和序贯博弈的扩展。
2.1 微分决策
为了将一个博弈扩展到连续时间,假设自然动作 (\theta(t)) 从集合 (\varTheta) 中选择,可定
超级会员免费看
订阅专栏 解锁全文
1046

被折叠的 条评论
为什么被折叠?



