可微分牛顿-欧拉算法在现实世界机器人中的应用
1 引言
在机器人控制中,从数据中识别动力系统是一项强大的工具。通过识别动力学参数,我们可以构建精确的控制合成,从而实现重力和惯性补偿。这不仅有助于减少数据驱动控制方法所需的样本复杂性,还能确保模型在训练数据之外的泛化能力。为了实现这一点,物理一致性至关重要。标准的黑盒模型,如深度网络,虽然可以高保真地拟合任意复杂的动态,但它们在训练分布之外的行为是未定义的,甚至可能违反基本的物理定律。因此,本篇文章将介绍一种结合经典系统识别技术和现代机器学习工具的新方法——可微分牛顿-欧拉算法(DiffNEA),它可以在现实世界机器人系统中学习到物理一致的动态模型。
2 动态模型表示
动态模型表示方法可以分为两类:黑盒模型和白盒模型。黑盒模型使用通用函数近似器(如深度网络)来表示系统动态,而白盒模型则使用运动的分析方程来形式化假设空间。以下是这两种模型的具体描述:
2.1 黑盒模型
黑盒模型使用通用函数近似器 ( f ) 和相应的抽象参数 ( \theta ) 来表示动态。这些近似器可以高保真地拟合任意复杂的动态,但其在训练分布之外的行为是未定义的。此外,这些模型只能学习正向或逆向模型,而不可解释。例如,常见的黑盒模型包括:
- 局部线性模型 :通过线性化局部动态来进行预测。
- 高斯过程 :使用概率分布来建模动态。
- 深度网络 :通过多层神经网络进行复杂动态的建模。
然而,黑盒模型的