标题:Inverse Reinforcement Learning with Natural Language Goals
作者:Li Zhou, Kevin Small
单位: 亚马逊Alexa
发表会议:AAAI
发表时间:2021年
论文研究主题归类:逆强化学习与自然语言
1.论文解决什么问题
机器人理解NL目标并将其映射到状态和操作序列比较难。目前学到的方法在推广到新的NL目标和环境方面时,会很困难。在本文中,作者提出了一种新的对抗性逆强化学习算法来学习语言条件策略和奖励函数。为了改进学习策略和奖励函数的泛化,作者使用一个可变目标生成器来重新标记轨迹,并在训练期间对不同的目标进行采样。在基于视觉的NL指令跟踪数据集上,算法大大优于多个基线,这表明在使用NL指令指定智能体目标方面取得了可喜的进步。
2.是否有公开的数据集及源代码
数据集:R2R Dataset | Papers With Code
源代码:未公开
3.论文的主要观点
机器人理解NL目标并将其映射到状态和操作序列比较难。目前学到的方法在推广到新的NL目标和环境方面时,会很困难。通过逆强化学习方法。来学习自然语言的奖励函数,从而让智能体能够更好的学习策略。对NL指令能够更好的解读和使用。