引言:语义导航是机器人实现复杂环境中自主探索的一项关键能力。在陌生环境中,机器人需要像人类一样,利用语义知识来推断空间布局,包括特定物体的位置和几何属性。例如,我们知道厕所和淋浴通常一起出现在浴室中,且通常靠近卧室。通过自然语言可以增强这种先验语义知识,从而更有效地指导机器人在未知环境中的探索。目前,传统的导航方法往往依赖于预构建的地图和特定任务的训练,这极大限制了机器人在新环境中的适应能力。此论文提出了一种零样本语义导航方法——视觉-语言前沿地图(VLFM),该方法受人类推理过程启发,能够在没有任务特定训练、预构建地图或环境先验知识的情况下,导航至期望目标。
【基本信息】
论文标题:VLFM: Vision-Language Frontier Maps for Zero-Shot Semantic Navigation
发表期刊:ICRA,Best paper in Cognitive Robotics
发表时间:2024年5月
【访问链接】
论文链接: https://openreview.net/pdf?id=gdw1zUTABk
代码仓库:https://github.com/bdaiinstitute/vlfm
【背景简介】
在机器人导航领域,目标导向导航(ObjectNav)是一个重要的研究方向。ObjectNav 任务要求机器人在未知环境中导航到特定的目标。这一任务的性能主要通过机器人路径的效率来衡量,即机器人能否高效地找到目标对象。对良好的语义先验知识的利用可以显著提高机器人定位目标对象的效率。传统的训练方法通常依赖于强化学习、模仿学习或预测语义俯视图,这些方法在模拟环境中表现出色,但在真实世界中的部署面临挑战,因为它们通常只在训练时使用的封闭对象集上有效,且往往仅在模拟数据上进行训练。
近年来,零样本目标导向导航(Zero-shot ObjectNav)方法逐渐兴起。这些方法旨在适应开放集的对象类别,通过大量真实世界数据上训练的模型实现在真实世界中的语义导航。与传统的任务特定训练方法不同,零样本方法不需要预构建的地图或特定任务的训练数据。
目前,基于前沿/边界的探索方法( frontier-based exploration method)有:

最低0.47元/天 解锁文章
360

被折叠的 条评论
为什么被折叠?



