将物理学与深度学习结合用于连续时间动力学模型
1. 引言
近年来,深度学习在机器人学中的应用展示出了巨大的潜力。深度网络能够高保真地模拟任意复杂的动态,但由于其黑箱特性,难以确保物理一致性,也无法解释学习到的模型。相比之下,基于物理学的传统方法能够保证模型的物理合理性,但往往需要大量的手动推导和参数化。为了解决这些局限性,物理学启发的深度网络应运而生。这类方法结合了深度学习的灵活性和物理学的结构性,使得模型既能保持物理一致性,又能处理复杂的现实世界任务。
2. 深度拉格朗日网络 (DeLaN)
深度拉格朗日网络(DeLaN)是物理学启发的深度网络的一个实例。DeLaN将质量矩阵 ( H ) 和势能 ( V ) 参数化为两个独立的深度网络,从而利用拉格朗日力学来推导运动方程。通过这种方式,DeLaN不仅能够学习物理上合理的动态模型,还能保持能量守恒。
2.1 DeLaN的结构
DeLaN的核心思想是使用两个深度网络来分别预测系统的动能和势能。具体来说,拉格朗日量 ( L ) 可以表示为:
[ L(q, \dot{q}) = T(q, \dot{q}) - V(q) = \frac{1}{2} \dot{q}^T H(q) \dot{q} - V(q) ]
其中 ( T ) 是动能,( V ) 是势能,( H(q) ) 是质量矩阵。这两个网络的参数通过最小化欧拉-拉格朗日微分方程的平方残差来学习:
[ \psi^ , \phi^ = \arg \min_{\psi, \phi} \left| \frac{d}{dt} \frac{\partial L}{\