ICCV 2025｜车道图的链式生成！高德将车道拓扑网学习革新为链式图扩展

原创于 2025-06-30 17:58:08 发布 · 422 阅读

CC 4.0 BY-SA版权

文章标签：

ICCV(International Conference on Computer Vision)是计算机视觉领域的国际顶级学术会议，也是中国计算机学会(CCF)推荐的A类国际学术会议，今年计划于10月19日至10月25日在美国夏威夷召开。本届ICCV会议共有11,239篇有效投稿，录用2698篇，录取率为 24%。高德技术团队共5篇论文被收录。

导读

准确的车道拓扑结构是实现高精度自动驾驶系统的核心要素之一，因为它直接决定了车辆对道路环境的理解能力和路径规划的准确性。然而，传统方法在处理现实世界道路结构时面临诸多挑战。例如，复杂的非线性拓扑结构（如环形交叉口、多向车道、双向单车道）往往难以通过规则化或简单的建模方式准确表达。这导致了现有方法在面对复杂场景时性能受限，无法满足实际应用的需求。

为此，高德视觉中心技术团队提出了SeqGrowGraph，一种全新的框架，旨在通过链式图扩展的方式生成车道拓扑结构。这一方法的灵感来源于人类绘制地图的过程：人类通常从局部开始逐步扩展，最终完成整个地图的绘制。

论文标题：SeqGrowGraph: Learning Lane Topology as a Chain of Graph Expansions
论文地址：发布后将更新至评论区

GitHub：发布后将更新至评论区

Introduction

自动驾驶的兴起对精确的道路结构建模提出了更高的要求，以确保安全高效的导航。道路结构不仅包括中心线、道路边缘和交通标志等显式特征，也包括隐式的拓扑关系，特别是中心线之间的连通性。构建车道图对于表示这些复杂结构至关重要，从而在动态环境中为车辆的决策和路径规划提供便利。

传统的车道图生成方法分为基于检测和基于生成两类方法，但各有其显著的局限性。基于检测的方法可分为三类：1) 像素级方法，在BEV空间中逐像素地分割车道结构，但难以推断全局拓扑关系。2) 片段级方法，基于拓扑点来检测分段的中心线片段，常常导致不连续和错位问题。3) 路径级方法，旨在通过检测车道路径来缓解不连续问题，但由于严重依赖后处理，又引入了冗余和对齐错误。

生成式模型通过捕捉隐藏的结构模式，提供了一种更直接的方法来推断车道图。然而，将车道图表述为序列带来了挑战，且现有的生成式模型存在一些局限性。现有的图到序列转换方法倾向于过度解构图的内在结构，导致转换过程破坏了原有的拓扑关系。

让我们思考一下人类是如何构建车道图的？人并不会一次性处理整个图，而是自然地从单个节点开始，逐步添加新元素，通过与已定义的节点建立连接来不断扩展图，如下图所示。

这种直观的方法启发了一种新的范式：1. 将车道图的构建建模为一个链式分步扩展图的过程，2. 使用序列建模来捕捉邻接矩阵的增量更新。我们提出了SeqGrowGraph，一个通过Sequence graph growth来增量式构建车道图的框架。SeqGrowGraph将车道图表示为一个有向图G=(V,E)其中V表示交叉口或关键拓扑节点，E表示中心线，定义了节点间的连通性。SeqGrowGraph将车道拓扑建模为一连串的图扩展过程：

引入一个带有其空间位置的新节点。

邻接矩阵 A从 n×n扩展到 (n+1)×(n+1) 以编码连通性，其上三角部分表示输入边（“from”关系），下三角部分表示输出边（“to”关系）。

一个几何矩阵 M更新中心线的形状，该形状由二次贝塞尔曲线表示。

一个基于Transformer的生成模型使用深度优先搜索顺序自回归地预测这些扩展。

与基于DAG（有向无环图）的方法不同，SeqGrowGraph能灵活地为复杂的真实世界道路结构建模，包括环路、双向车道和非平凡拓扑，而无需过多的预处理或后处理。我们的主要贡献如下：

引入了SeqGrowGraph，一个将车道图生成问题重塑为序列扩展过程的新颖框架，它利用了邻接矩阵更新和几何建模。

开发了一个基于自回归Transformer的模型，渐进式地构建车道图，克服了基于DAG方法的局限。

在大规模数据集（nuScenes、Argoverse 2）上取得了最先进的性能，展示了其卓越的拓扑准确性和网络完整性。

SeqGrowGraph为车道拓扑建模提供了一个实用有效的解决方案，与人类构建地图的自然方式高度一致。

Approach

序列构建

文章提出了 SeqGrowGraph，一种全新的框架，通过链式图扩展来学习车道拓扑结构，其灵感来源于人类绘制地图的过程。通过将车道图表示为有向图G=(V,E)，其中节点V表示交叉路口，边E表示车道中心线，SeqGrowGraph逐步构建该图，每次引入一个新节点。在每一步中，邻接矩阵A从n×n扩展为(n+1)×(n+1) 以编码连接关系，同时几何矩阵M利用二次贝塞尔曲线捕捉中心线的形状。图被序列化为一系列子序列，使得 Transformer 模型能够基于深度优先搜索顺序自回归地预测扩展链。

下图展示了具体的编码过程，每个节点对应一个交叉路口，边则表示车道中心线。在每一步中，我们描述一个新的交叉路口节点及其相连的中心线，重点关注新引入节点与现有节点之间的拓扑关系。为了更便于将图结构格式化为序列，我们将新节点作为主体来描述其拓扑结构。术语“from”和“to”分别表示新节点可以“来自”哪些节点以及“通往”哪些节点。例如，当描述一个新节点时，SeqGrowGraph会指定其位置以及与现有节点的连接关系，这对应于邻接矩阵中第n行和第n列的非零元素。通过逐行逐列地扩展邻接矩阵，SeqGrowGraph生成了一系列子图，并将这些子图逐步合并以形成完整的车道图。将一个完整的车道图转换成序列后，我们利用生成式的transformer从相机图中学习如何构造这个序列。

下图展示了具体的序列表达。每个节点的序列包含其几何形状、相邻节点信息以及连接中心线的贝塞尔控制点。通过将这些序列串联起来，SeqGrowGraph生成了目标序列。这种序列化的表示方式不仅能够更加灵活地表达拓扑结构，同时保持了清晰性和简洁性，并保留了图级别的关键信息。

模型结构

方法首先使用BEV编码器LSS将从环视图像中提取的特征投影到BEV平面上。在将车道图转换为序列后，采用一个Transformer解码器来逐个token地生成序列。整体架构如下图所示。

Experiments

我们将方法与最先进的方法进行比较。表1比较了SeqGrowGraph与最先进的方法在nuScenes数据集上使用default和PON split的结果。SeqGrowGraph在标志点（landmarks）和可达性（reachability）的F1分数上均优于现有算法。在PON划分中，由于训练集和测试集之间没有场景重叠，所有方法的性能都显著下降，但SeqGrowGraph依然保持领先地位。

我们在nuScenes数据集上对各种算法生成的最终结果进行了可视化比较，下图所示。相比之下，SeqGrowGraph不仅提供了稳定和鲁棒的建模，还能有效合并地面实况数据中存在的冗余点，从而在构建车道图方面取得了更优越的结果，凸显了SeqGrowGraph在克服这些挑战方面的有效性和可靠性。

Conclusion

本文提出了SeqGrowGraph，一个用于车道图自回归建模的创新框架。它通过增量式的局部增长将车道图转换为序列，从而促进了对全局结构的全面理解。该方法能够灵活地表示复杂的道路结构，包括环路和双向车道，而这些结构对传统的基于DAG的方法构成了挑战。在nuScenes和Argoverse 2数据集上进行的大量实验表明，与现有的基于检测和基于生成的方法相比，SeqGrowGraph在拓扑准确性和网络完整性方面表现出更优越的性能，通过引入类人结构化推理与序列建模，推动了车道图构建技术的发展，从而为动态环境下的自动驾驶提供精确的中心线。