基于人类个性框架的神经网络控制高层设计流程
1. 引言
在设计包含大偏差和显著非线性的系统动力学学习控制时存在困难,以机器人操纵器为例来开发和测试相关思路。大多数文献中的学习控制技术在处理机器人末端执行器的跟踪控制时,试图消除重力影响,或补偿速度相关的非线性因素(如摩擦、科里奥利力和向心力等)。但目前文献中提出同时学习重力和这些非线性项的方法,大多是顺序进行而非同时进行。
问题的难点在于处理这两类问题需要不同的学习方式。重力属于有显著偏差的非线性项,控制系统通常用前馈项来消除这类偏差;而像机器人操纵器中的一些速度相关项,在速度为零时趋近于零,属于无偏差非线性项,补偿这类非线性需要非线性反馈。
从设计者角度看,对于无偏差非线性项,使用泄漏项遗忘因子将权重推向零的方法在实践中效果较好;但对于有偏差非线性项,这种方法会导致稳态误差。自适应控制领域为有偏差非线性项提供了死区、参数投影和监督泄漏等方法,但这些方法需要系统参数和预期干扰的先验知识,很多人不将其视为真正的学习系统。
这里使用先前提出的人类个性图形模型来研究该问题,基于反馈理论的计算模型能预测人类群体中Myers - Briggs行为技术类型的概率分布。这种受生物启发的视角为高级控制系统应用的高层设计提供了更直观的方法,还提出了一种优化方法来设计学习控制器的所有控制参数,这是将LQR方法扩展到非线性系统的首个正式设计方法。
传统的控制设计方法存在不足,如通过试错、经验法则选择增益和参数,在处理机器人与未知、非结构化环境交互等当代问题时不够有效。而优化方法虽有解决问题的潜力,但设计成本泛函的标准高层认知框架仍是一个开放问题。本文提供了一种受生物启发的方法来设计成本泛函和权重值,利用人类个性模
超级会员免费看
订阅专栏 解锁全文
6575

被折叠的 条评论
为什么被折叠?



