结合物理学和深度学习的连续时间动力学模型
1. 引言
近年来,深度学习在机器人技术中的应用展示了其在学习使用方式上的巨大潜力。许多机器人学习方法现在都包含深度网络,用于选择动作的策略、预测下一个状态的动态模型或从非结构化观察中提取相关特征的状态估计器。然而,标准深度网络通常无法捕捉物理系统的底层结构,导致泛化能力差和对未见过状态的预测不准确。为此,将物理学原理与深度学习相结合,可以提高模型的物理一致性和泛化能力。
2. 深度拉格朗日网络 (DeLaN)
2.1 深度拉格朗日网络的定义
深度拉格朗日网络(DeLaN)是一种结合拉格朗日力学与深度网络的方法,用于学习机械系统的连续时间动态模型。DeLaN使用两个独立的深度网络来参数化系统的动能和势能,从而通过拉格朗日力学推导出运动方程。这种参数化确保了所学习的模型能够保持能量守恒,并且具有可解释性。
2.1.1 动能和势能的参数化
动能 ( T ) 和势能 ( V ) 分别由两个深度网络参数化:
[
T(q, \dot{q}; \psi) = \frac{1}{2} \dot{q}^T H(q; \psi) \dot{q}
]
[
V(q; \phi) = V(q; \phi)
]
其中 ( H(q; \psi) ) 是质量矩阵,( q ) 是广义坐标,( \dot{q} ) 是广义速度,( \psi ) 和 ( \phi ) 分别是动能和势能网络的参数。
2.2 拉格朗日量和欧拉-拉格朗日方程
拉格朗日量 ( L ) 定