开源的自动驾驶视觉语言模型标注数据集

最新推荐文章于 2025-11-25 14:32:13 发布

原创最新推荐文章于 2025-11-25 14:32:13 发布 · 744 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#ROS #自动驾驶 #机器学习 #算法

开源的自动驾驶视觉语言模型标注数据集

收集了一些关于vlm的开源数据集，供参考

开源项目列表

项目名称	描述	链接
VLM-R1	基于Qwen2.5-VL和R1强化学习技术的开源视觉语言模型，支持图像和文本的联合处理	GitHub - VLM-R1
VLMEvalKit	大型视觉语言模型的开源评估工具包，支持多种评估任务	GitHub - VLMEvalKit
SmolVLM	小巧、快速、内存高效的开源视觉语言模型，包含模型检查点、数据集和训练工具	Hugging Face - SmolVLM
Molmo VLM	开源视觉语言模型家族，适用于指向、计数、视觉问答等任务	Learn OpenCV - Molmo VLM
VisionArena-Battle	包含30K真实世界图像对话和偏好投票的标注数据集	Hugging Face - VisionArena-Battle
LlavaGuard	基于VLM的视觉保护框架，包含高质量人工标注的多模态安全数据集	arXiv - LlavaGuard
VLFeedback	开源的GPT-4V标注视觉语言偏好数据集，包含80K指令和多个大型视觉语言模型的响应	VLFeedback
Touch-Vision-Language Dataset	结合触觉、视觉和语言的多模态对齐数据集，包含43,741个图像-触觉对	Touch-Vision-Language Dataset
Prometheus-Vision	用于细粒度评估的视觉语言模型，模拟人类评估者和GPT-4V的反馈	Prometheus-Vision
SAIL-VL	通过高质量数据管理实现可扩展训练的开源视觉语言模型系列	arXiv - SAIL-VL

以上是关于自动驾驶视觉语言模型标注数据集的开源项目列表，每个项目都提供了不同的功能和数据集，适用于不同的研究和应用场景。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

白云千载尽 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。