ICCV 2025|车道图的链式生成!高德将车道拓扑网学习革新为链式图扩展

ICCV(International Conference on Computer Vision)是计算机视觉领域的国际顶级学术会议,也是中国计算机学会(CCF)推荐的A类国际学术会议,今年计划于10月19日至10月25日在美国夏威夷召开。本届ICCV会议共有11,239篇有效投稿,录用2698篇,录取率为 24%。高德技术团队共5篇论文被收录。

导读

准确的车道拓扑结构是实现高精度自动驾驶系统的核心要素之一,因为它直接决定了车辆对道路环境的理解能力和路径规划的准确性。然而,传统方法在处理现实世界道路结构时面临诸多挑战。例如,复杂的非线性拓扑结构(如环形交叉口、多向车道、双向单车道)往往难以通过规则化或简单的建模方式准确表达。这导致了现有方法在面对复杂场景时性能受限,无法满足实际应用的需求。

为此,高德视觉中心技术团队提出了SeqGrowGraph,一种全新的框架,旨在通过链式图扩展的方式生成车道拓扑结构。这一方法的灵感来源于人类绘制地图的过程:人类通常从局部开始逐步扩展,最终完成整个地图的绘制。

  • 论文标题:SeqGrowGraph: Learning Lane Topology as a Chain of Graph Expansions

  • 论文地址:发布后将更新至评论区

  • GitHub:发布后将更新至评论区

Introduction

自动驾驶的兴起对精确的道路结构建模提出了更高的要求,以确保安全高效的导航。道路结构不仅包括中心线、道路边缘和交通标志等显式特征,也包括隐式的拓扑关系,特别是中心线之间的连通性。构建车道图对于表示这些复杂结构至关重要,从而在动态环境中为车辆的决策和路径规划提供便利。

传统的车道图生成方法分为基于检测和基于生成两类方法,但各有其显著的局限性。基于检测的方法可分为三类:1) 像素级方法,在BEV空间中逐像素地分割车道结构,但难以推断全局拓扑关系。2) 片段级方法,基于拓扑点来检测分段的中心线片段,常常导致不连续和错位问题。3) 路径级方法,旨在通过检测车道路径来缓解不连续问题,但由于严重依赖后处理,又引入了冗余和对齐错误。

生成式模型通过捕捉隐藏的结构模式,提供了一种更直接的方法来推断车道图。然而,将车道图表述为序列带来了挑战,且现有的生成式模型存在一些局限性。现有的图到序列转换方法倾向于过度解构图的内在结构,导致转换过程破坏了原有的拓扑关系。

让我们思考一下人类是如何构建车道图的?人并不会一次性处理整个图,而是自然地从单个节点开始,逐步添加新元素,通过与已定义的节点建立连接来不断扩展图,如下图所示。

      这种直观的方法启发了一种新的范式:1. 将车道图的构建建模为一个链式分步扩展图的过程,2. 使用序列建模来捕捉邻接矩阵的增量更新。我们提出了SeqGrowGraph,一个通过Sequence graph growth来增量式构建车道图的框架。SeqGrowGraph将车道图表示为一个有向图G=(V,E)其中V表示交叉口或关键拓扑节点,E表示中心线,定义了节点间的连通性。SeqGrowGraph将车道拓扑建模为一连串的图扩展过程:

  • 引入一个带有其空间位置的新节点。

  • 邻接矩阵 A从 n×n扩展到 (n+1)×(n+1) 以编码连通性,其上三角部分表示输入边(“from”关系),下三角部分表示输出边(“to”关系)。

  • 一个几何矩阵 M更新中心线的形状,该形状由二次贝塞尔曲线表示。

  • 一个基于Transformer的生成模型使用深度优先搜索顺序自回归地预测这些扩展。

     与基于DAG(有向无环图)的方法不同,SeqGrowGraph能灵活地为复杂的真实世界道路结构建模,包括环路、双向车道和非平凡拓扑,而无需过多的预处理或后处理。我们的主要贡献如下:

  • 引入了SeqGrowGraph,一个将车道图生成问题重塑为序列扩展过程的新颖框架,它利用了邻接矩阵更新和几何建模。

  • 开发了一个基于自回归Transformer的模型,渐进式地构建车道图,克服了基于DAG方法的局限。

  • 在大规模数据集(nuScenes、Argoverse 2)上取得了最先进的性能,展示了其卓越的拓扑准确性和网络完整性。

      SeqGrowGraph为车道拓扑建模提供了一个实用有效的解决方案,与人类构建地图的自然方式高度一致。

Approach

  • 序列构建

文章提出了 SeqGrowGraph,一种全新的框架,通过链式图扩展来学习车道拓扑结构,其灵感来源于人类绘制地图的过程。通过将车道图表示为有向图G=(V,E),其中节点V表示交叉路口,边E表示车道中心线,SeqGrowGraph逐步构建该图,每次引入一个新节点。在每一步中,邻接矩阵A从n×n扩展为(n+1)×(n+1) 以编码连接关系,同时几何矩阵M利用二次贝塞尔曲线捕捉中心线的形状。图被序列化为一系列子序列,使得 Transformer 模型能够基于深度优先搜索顺序自回归地预测扩展链。

下图展示了具体的编码过程,每个节点对应一个交叉路口,边则表示车道中心线。在每一步中,我们描述一个新的交叉路口节点及其相连的中心线,重点关注新引入节点与现有节点之间的拓扑关系。为了更便于将图结构格式化为序列,我们将新节点作为主体来描述其拓扑结构。术语“from”和“to”分别表示新节点可以“来自”哪些节点以及“通往”哪些节点。例如,当描述一个新节点时,SeqGrowGraph会指定其位置以及与现有节点的连接关系,这对应于邻接矩阵中第n行和第n列的非零元素。通过逐行逐列地扩展邻接矩阵,SeqGrowGraph生成了一系列子图,并将这些子图逐步合并以形成完整的车道图。将一个完整的车道图转换成序列后,我们利用生成式的transformer从相机图中学习如何构造这个序列。

下图展示了具体的序列表达。每个节点的序列包含其几何形状、相邻节点信息以及连接中心线的贝塞尔控制点。通过将这些序列串联起来,SeqGrowGraph生成了目标序列。这种序列化的表示方式不仅能够更加灵活地表达拓扑结构,同时保持了清晰性和简洁性,并保留了图级别的关键信息。

  • 模型结构

方法首先使用BEV编码器LSS将从环视图像中提取的特征投影到BEV平面上。在将车道图转换为序列后,采用一个Transformer解码器来逐个token地生成序列。整体架构如下图所示。

Experiments

我们将方法与最先进的方法进行比较。表1比较了SeqGrowGraph与最先进的方法在nuScenes数据集上使用default和PON split的结果。SeqGrowGraph在标志点(landmarks)和可达性(reachability)的F1分数上均优于现有算法。在PON划分中,由于训练集和测试集之间没有场景重叠,所有方法的性能都显著下降,但SeqGrowGraph依然保持领先地位。

我们在nuScenes数据集上对各种算法生成的最终结果进行了可视化比较,下图所示。相比之下,SeqGrowGraph不仅提供了稳定和鲁棒的建模,还能有效合并地面实况数据中存在的冗余点,从而在构建车道图方面取得了更优越的结果,凸显了SeqGrowGraph在克服这些挑战方面的有效性和可靠性。

Conclusion

本文提出了SeqGrowGraph,一个用于车道图自回归建模的创新框架。它通过增量式的局部增长将车道图转换为序列,从而促进了对全局结构的全面理解。该方法能够灵活地表示复杂的道路结构,包括环路和双向车道,而这些结构对传统的基于DAG的方法构成了挑战。在nuScenes和Argoverse 2数据集上进行的大量实验表明,与现有的基于检测和基于生成的方法相比,SeqGrowGraph在拓扑准确性和网络完整性方面表现出更优越的性能,通过引入类人结构化推理与序列建模,推动了车道图构建技术的发展,从而为动态环境下的自动驾驶提供精确的中心线。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值