DriveBench：VLM在自动驾驶中真的可靠吗？（ICCV‘25）

最新推荐文章于 2025-12-21 19:01:45 发布

转载最新推荐文章于 2025-12-21 19:01:45 发布 · 111 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247674504&idx=1&sn=7be8e0155caa73d4594e7cf166f59819&chksm=cf398d7cfe5e31f3e5a7d4b60f5aac2bb08fb4284dfb3975d740f0806a74843ecb78be1d8ad1&scene=126&sessionid=0

文章标签：

#自动驾驶 #人工智能 #机器学习

部署运行你感兴趣的模型镜像

点击下方卡片，关注“自动驾驶之心”公众号

戳我-> 领取自动驾驶近30个方向学习路线

>>直播和内容获取转到 → 自动驾驶之心知识星球

点击按钮预约直播

视觉语言模型（VLM）的最新进展激发了人们将其应用于自动驾驶的兴趣，尤其是通过自然语言生成可解释的驾驶决策。然而关于VLM是否能为驾驶提供基于视觉的、可靠的且可解释的解释，这一假设在很大程度上尚未得到验证。为填补这一空白，我们推出了DriveBench，这是一个基准数据集，旨在评估VLM在17种设置下的可靠性，包含19,200帧、20,498个问答对、三种问题类型、四种主流驾驶任务以及总共12个流行的VLM。

自动驾驶之心很荣幸邀请到加州大学尔湾分校在读博士生 - 谢少远，为大家分享介绍这篇ICCV 2025中稿的DriveBench。一个专为自动驾驶设计的视觉语言模型(VLMS)基准测试框架，旨在评估VLMs在不同环境和任务下的可靠性。DriveBench涵盖感知、预测、规划和行为四大核心任务，并引入 15种OoD类型，以系统性测试VLMs 在复杂驾驶场景中的可靠性。今天上午十一点，锁定自动驾驶之心直播间，我们不见不散~