探索机器人技术中的机器学习归纳偏置:开放问题与未来工作
1. 学习动态模型
在机器人技术中,学习动态模型是至关重要的,因为它直接影响控制策略的有效性和鲁棒性。目前,已有两种主要算法用于学习动态模型:可微分的牛顿-欧拉算法(DiffNEA)和深度拉格朗日网络(DeLaN)。尽管这些方法在某些方面表现出色,但仍存在若干开放问题和挑战,需要进一步研究以提升其适用性和性能。
1.1 接触模型的处理
许多现实世界中的机器人任务涉及接触,如抓取、行走和碰撞避免。然而,现有的模型学习方法,包括DiffNEA和DeLaN,主要关注无接触的铰接体系统。为了扩展这些方法的应用范围,必须将接触模型纳入其中。
理论上,可以使用解析接触模型将接触包括在DeLaN或DiffNEA中。碰撞检测器可以确定所有接触点及其相应的雅可比矩阵,之后通过解决线性互补问题(LCP)来计算接触力。不同研究人员已经证明这种计算是可微的,因此可以添加到这两种方法中。例如,弹跳的圆盘、牛顿摆和带有地板的n连杆摆等简单例子已经成功实现了这种方法。
然而,这种方法的主要问题是假设运动链和身体网格是已知的。这两个模型都需要碰撞检测器来确定接触点和雅可比。虽然对于DiffNEA来说这个假设是可以接受的,但对于DeLaN来说过于限制。因此,未来的工作应尝试将分析接触模型与DiffNEA结合,扩展到多接触问题,并使用可学习的表示形式来表示网格。对于DeLaN,可以考虑将接触建模为推动穿透物体的势场,但这需要解决在未观察到数据的区域学习一致势场的挑战。
1.2 广义坐标的处理
大多数机器人系统,尤其是那些不仅仅是刚体机械臂的系统,通常不观察或了解广义坐标(如