结合物理学与深度学习的连续时间动力学模型
1 引言
在过去五年中,深度学习在机器人学中展现出了巨大的潜力,尤其是在学习动态模型方面。通过结合拉格朗日力学与深度网络,我们可以学习物理上合理的刚体系统的连续时间动力学模型。这种结合使得机器人学能够学习到更好的表示,并保留了深度网络的优势,如通用适用性和高模型容量。
深度学习与微分方程的结合早已为人所知,并以更抽象的形式进行了研究。不同作者提出使用纳维-斯托克斯方程、薛定谔方程、伯格斯方程、哈密顿方程或欧拉-拉格朗日方程。这些方法通过最小化相应微分方程的残差来获得最优网络参数。此外,对称性也可以通过选择一种非线性变换来整合到网络架构中,这种变换要么是等变的,要么对输入的特定变换是不变的。
2 物理学启发的深度网络
2.1 深度拉格朗日网络 (DeLaN)
深度拉格朗日网络(DeLaN)将质量矩阵 ( H ) 和势能 ( V ) 参数化为两个独立的深度网络。因此,由 ( H ) 和 ( V ) 描述的近似拉格朗日 ( L ) 使用这种参数化,可以推导出前向模型和逆向模型。前向模型 ( \ddot{q} = f(q, \dot{q}, \tau; \psi, \phi) ) 由下式描述:
[
\ddot{q} = \left[\frac{\partial^2 L(q, \dot{q})}{\partial \dot{q}^2}\right]^{-1}\left[\tau - \frac{\partial L(q, \dot{q})}{\partial q \partial \dot{q}} \dot{q} + \frac{\partial L(q, \dot{q}