数据猎手小k-优快云博客

原创 Hulu-Med；目前最大、最透明、覆盖 14 种影像模态的 1670 万公开+合成医学多模态数据集

2025-12-05，由浙江大学-UIUC、阿里巴巴、上海交大等联合推出开源医学多模态大模型 Hulu-Med，自带 1670 万公开/合成样本，覆盖 12 大解剖系统、14 种影像模态。首次在 7B-32B 参数规模内把文本、2D/3D 图像、视频理解整合进同一架构。

2025-11-15 16:36:26 978

原创 ER-Reason ：首个模拟急诊室临床决策的新型基准数据集

2025-05-29，由加州大学伯克利分校和加州大学旧金山分校的研究团队创建了名为ER-Reason的数据集，目的评估大型语言模型在急诊室中的临床推理能力。该数据集包含3,984名患者的25,174份去标识化临床笔记，覆盖急诊室工作流程的各个阶段，并提供了72份专家撰写的推理过程。该数据集的创建为评估LLM在真实世界临床决策中的表现提供了新的视角，揭示了LLM生成的临床推理与临床医生撰写的推理之间存在差距，为未来的研究指明了方向。

2025-06-04 17:42:38 809

原创 SynGrasp-1B:全球首个十亿帧机器人抓取数据集，助力零样本泛化和少样本适应.

2025-05-06, 由Galbot、北京大学、香港大学和北京人工智能研究院联合创建的SynGrasp-1B数据集，是全球首个十亿帧的机器人抓取数据集，其意义在于为机器人抓取任务提供了一个大规模的合成动作数据集，使得机器人能够在零样本和少样本的情况下，实现对新任务的快速适应和泛化。

2025-05-09 10:25:12 1048

原创 AMO数据集：解决运动模仿偏差的超灵巧人形机器人全身控制混合数据集。

2025-05-07，由加州大学圣地亚哥分校创建了 Adaptive Motion Optimization (AMO) 数据集，该数据集通过结合运动捕捉数据和概率采样的躯干姿态，生成全身参考动作，以解决运动模仿强化学习中的分布偏差问题。

2025-05-08 16:16:37 1588

原创 FoMo 数据集是一个专注于机器人在季节性积雪变化环境中的导航数据集，记录了不同季节（无雪、浅雪、深雪）下的传感器数据和轨迹信息。

2025-05-02，由加拿大拉瓦尔大学北方机器人实验室和多伦多大学机器人研究所联合创建的 FoMo 数据集，目的是研究机器人在季节性积雪变化环境中的导航能力。该数据集的意义在于填补了机器人在极端季节变化（如积雪深度变化）下的导航研究空白，为开发更可靠的机器人导航系统提供了宝贵的数据支持。

2025-05-06 17:52:05 1420

原创 HRScene：首个覆盖多场景高分辨率图像理解的综合性基准数据集

2025-04-25，由宾夕法尼亚州立大学和亚马逊网络服务的研究团队创建了 HRScene 数据集，这是一个用于高分辨率图像（HRI）理解的统一基准数据集。该数据集整合了 25 个真实世界的数据集和 2 个合成诊断数据集，涵盖了从微观到遥感的丰富场景，分辨率从 1024×1024 到 35,503×26,627。HRScene 的创建填补了高分辨率图像理解领域的空白，为评估视觉语言模型在高分辨率图像处理上的有效性提供了重要工具。

2025-04-29 14:41:58 981

原创 CoOAG：首个捕捉学术研究兴趣动态演变的数据集

2025-04-24，由西安交通大学基于学术合作网络构建一种新的动态图数据集CoOAG，用于研究动态图中的节点分类问题。该数据集通过捕捉作者研究兴趣的动态变化，为动态图学习领域提供了新的研究方向和测试平台，特别是在标签受限的动态节点分类任务中具有重要意义。

2025-04-27 18:07:52 1116

原创 DLC-Bench：由英伟达等机构联合创建的基准测试数据集，用于评估详细局部描述。它通过预定义的正负属性集合来评估模型生成的描述，突破了传统依赖参考描述的限制。

2025-04-23 , 由 NVIDIA、UC Berkeley 和 UCSF 等机构的研究人员创建了 Describe Anything Model（DAM）以及相关数据集和基准测试。DAM 通过关键创新（如焦点提示和局部视觉主干）解决了详细局部描述（DLC）中区域细节丢失、高质量数据稀缺和基准测试限制等挑战，为图像和视频的细粒度描述开辟了新道路。

2025-04-24 15:38:49 746

原创 PHYBench:首个大规模物理场景下的复杂推理能力评估基准

2025-04-23, 由北京大学物理学院和人工智能研究所等机构共同创建的 PHYBench 数据集，这是一个专门用于评估大型语言模型在物理场景下的复杂推理能力的高质量基准。该数据集包含 500 道精心策划的物理问题，覆盖力学、电磁学、热力学、光学、现代物理和高级物理等多个领域，难度从高中练习题到本科习题和物理奥林匹克竞赛挑战不等。

2025-04-24 14:16:03 1231

原创 Eyecare-100K：首个覆盖多模态、多任务的高质量眼科视觉指令数据集

2025-04-18 , 由浙江大学、哈尔滨工业大学、郴州市第一人民医院、新加坡国立大学等机构合作创建了 Eyecare-100K数据集，这是首个涵盖多种模态、任务和疾病的高质量眼科视觉指令数据集，为眼科智能诊断领域提供了关键资源，推动了医学视觉语言模型（Med-LVLMs）在眼科的精细化理解与应用。

2025-04-23 17:53:26 1106

原创最全糖尿病数据集（不定时更新）

糖尿病已成为一项全球性的健康挑战，中国糖尿病患病率从1980年的不足1%增长至2018年的12.4%，2019年达到11.2%，目前患者人数已超过1.14亿，中国拥有世界上最多的糖尿病患者，超过全球糖尿病患者总数的四分之一。

2025-04-22 15:38:36 2913

原创 EuroCropsML：首个面向少样本时间序列作物分类的多国基准数据集

2025-04-15，由慕尼黑工业大学等机构创建的 EuroCropsML 数据集，这是一个结合了农民报告的作物数据与 Sentinel-2 卫星观测的时间序列数据集，覆盖了爱沙尼亚、拉脱维亚和葡萄牙。该数据集为解决遥感应用中作物类型数据空间不平衡问题提供了新的基准，有助于推动少样本学习和迁移学习算法在真实世界作物分类任务中的应用和评估。

2025-04-17 14:44:27 1336

原创 DataDoP ：一个大规模多模态数据集，包含 29K 真实世界的自由运动相机轨迹、深度图和详细的动作描述，目的支持艺术化相机轨迹生成。

2025-04-10 ，由浙江大学、上海人工智能实验室、斯坦福大学、香港中文大学和南洋理工大学联合创建了 DataDoP 数据集。该数据集包含 29K 真实世界的自由运动相机轨迹、深度图和详细的动作描述，目的为艺术化相机轨迹生成提供高质量的训练数据，推动基于学习的电影摄影技术发展。

2025-04-11 14:51:57 1280

原创 ACPBench Hard数据集：通过开放性生成任务，将规划过程中的推理能力挑战推向极致。

2025-04-01，由IBM创建的ACPBench Hard数据集，通过开放性生成任务，将规划过程中的推理能力挑战推向极致，为评估和提升模型在行动、变化和规划方面的推理能力提供了全新视角，也为未来规划领域模型的发展指明了方向。

2025-04-03 10:35:53 830

原创 iNatAg:一个大规模的农业图像数据集，包含 2,959 个物种的 470 多万张图像，使其成为迄今为止最大的单一农业图像数据集合之一.

2025-03-29,由加州大学戴维斯分校和普林斯顿大学等机构联合创建的iNatAg数据集，包含 2,959 个物种的 470 多万张图像，为精准农业和可持续发展提供了强大的支持。该数据集不仅能够帮助研究人员更好地识别农作物和杂草，还能为农业机器学习工作流程提供直接的访问和集成，极大地推动了农业领域的技术进步。

2025-04-02 14:33:23 1455

原创 SynTIDE：首个基于文本生成水下图像与密集注释数据集

2025-03-28，由华中科技大学的研究团队创建一种创新的水下数据合成方法 TIDE（Text-to-Image and DEnse annotation generation method）。该方法仅依赖文本输入，就能同时生成逼真的水下图像和多种高度一致的密集注释（如深度图和语义分割掩码）。TIDE 的出现有效缓解了水下场景中高质量、大规模密集注释数据稀缺的问题，为水下密集预测任务（如深度估计和语义分割）提供了强大的数据支持，有望推动水下视觉技术的发展，并为其他领域数据稀缺问题提供新思路。

2025-04-01 11:33:52 1470

原创 DexGrasp Anything：迄今为止最大、最多样化的灵巧抓握生成数据集

2025-03-03，由上海科技大学的研究团队创建了DexGrasp Anything（DGA）的数据集，这是目前规模最大的灵巧抓取数据集，包含超过340万种不同抓取姿势，涵盖15000多个不同物体。该数据集的创建为机器人灵巧抓取领域带来了重大意义，显著提升了现有方法的泛化能力和抓取成功率，推动了通用机器人灵巧抓取技术的发展。

2025-03-31 15:52:59 1402

原创 PartDrag-4D：大规模多视角零件级动态数据集，包含超过 20,000 个状态的观测数据，目的支持 4D 重建模型的训练和评估。

2025-03-26，由清华大学、密歇根大学、北京大学和 BAAI 等机构联合创建PartDrag-4D 的数据集。该数据集包含超过 20,000 个状态的多视角零件级动态观测数据，目的解决现有方法在建模零件级动态时的局限性，如 2D 视频表示的限制和处理速度慢等问题。PartDrag-4D 的创建为零件级动态建模提供了丰富的数据支持，推动了机器人操作、AR/VR 等领域的研究进展。

2025-03-27 13:46:45 823

原创 REALM：一个包含超过 94,000 个大规模记录真实世界大语言模型应用的数据集

2025-03-24 ,由卡内基梅隆大学和加州大学圣塔芭芭拉分校的研究团队创建REALM数据集，该数据集包含超过94,000个从Reddit和新闻文章中收集的LLM用例，涵盖了LLM的多样化应用和用户群体特征。它为研究LLM在不同领域的应用提供了实证基础，有助于推动对LLM社会角色演变的理解。

2025-03-26 17:21:02 1234

原创 PCLT20K：首个公开的大规模PET-CT肺癌肿瘤分割数据集

2025-03-22 ，由湖南大学、南开大学、湖南师范大学和天津医科大学肿瘤研究所共同创建的名为PCLT20K的PET-CT肺癌肿瘤分割数据集。该数据集包含21930对来自605名患者的PET-CT图像，是目前首个公开的大规模PET-CT肺癌肿瘤分割数据集，为相关领域的研究提供了丰富的数据资源，有助于推动PET-CT肺癌肿瘤分割技术的发展。

2025-03-25 13:37:16 1593 1

原创 2025中国AI Agent 行业研究报告|附文件下载

2025中国AI Agent 行业研究报告

2025-03-24 16:49:16 284

原创 GAEA-1.6M：大型对话式地理定位数据集

2025-03-21，由美国中央佛罗里达大学的研究团队提出了一种名为 GAEA 的地理感知对话模型，并为此创建了 GAEA-1.6M 数据集。其意义在于填补了地理定位对话模型训练数据的空白，使得模型不仅能够预测图像的精确 GPS 坐标，还能与用户进行关于图像位置的有意义对话，为旅游、导航、城市规划等领域带来了新的可能性。

2025-03-24 16:23:54 1116

原创 SynthScars：含12236张全合成图像的高质量多样化检测数据集，有像素级伪影分割、文本解释及类别标签标注。

2025-03-19,由上海交通大学、上海人工智能实验室、北京航空航天大学、中山大学和商汤研究联合创建的 SynthScars 数据集。该数据集的创建目的是解决现有合成图像检测数据集的局限性，为合成图像检测研究提供更具挑战性和实用性的基准。

2025-03-21 13:58:25 973

原创 DAPO-Math-17K：一个包含17,000个数学问题及其整数答案的数据集，专为大规模LLM强化学习设计，经过精心转换以确保准确的奖励信号。

2025-03-17, 由字节跳动、清华大学人工智能产业研究院、香港大学和清华大学AIR-SIA实验室联合创建了DAPO系统及其配套的DAPO-Math-17K数据集。该数据集通过精心设计和转换，为大规模LLM强化学习提供了高质量的数学问题和答案，助力模型在复杂推理任务上取得显著提升，推动了LLM在数学领域的应用和发展。

2025-03-20 10:57:51 969

原创 MicroVQA：首个针对显微镜科学研究的多模态推理基准数据集

2025-03-18，由斯坦福大学、清华大学等联合创建了 MicroVQA 数据集，这是一个针对显微镜科学研究的视觉问答基准，目的评估专家图像理解、假设生成和实验设计这三种对科学研究至关重要的推理能力，填补了现有基准在复杂多模态科学推理方面的空白，为推动 AI 驱动的生物医学研究提供了宝贵资源。

2025-03-19 17:08:35 1293

原创 PH2D数据集: 用人类演示数据提升人形机器人操作能力，助力跨实体学习

2025-03-18, 由加州大学圣地亚哥分校, 卡内基梅隆大学, 华盛顿大学, 麻省理工学院等机构联合收集了PH2D数据集。该数据集包含26824个任务导向的人类演示，采用消费者级VR设备收集，提供了准确的3D手部关键点姿态和语言注释。数据集覆盖了多种操作任务、不同的物体和容器，旨在通过模仿人类行为来学习人形机器人的操作策略，促进跨模态学习并提高机器人政策的泛化能力和鲁棒性。

2025-03-19 15:56:12 1249

原创 WideRange4D: 一个包含丰富4D场景数据的新基准数据集

2025-03-11 ,由北京大学、中国科学院大学和新加坡国立大学联合提出了一种新的4D重建基准数据集WideRange4D。该数据集通过引入具有大范围空间运动的4D场景数据，填补了现有4D重建数据集在复杂动态场景中的空白，为4D重建方法的全面评估提供了更具挑战性和多样性的基准。

2025-03-18 16:32:55 888

原创 EmbodiedSAM：在线实时3D实例分割,利用视觉基础模型实现高效场景理解

2025-02-12，由清华大学和南洋理工大学的研究团队开发一种名为 EmbodiedSAM（ESAM）的在线3D实例分割框架。该框架利用2D视觉基础模型辅助实时3D场景理解，解决了高质量3D数据稀缺的难题，为机器人导航、操作等任务提供了高效、准确的视觉感知能力。

2025-03-18 15:22:12 1254

原创 GoT：一个包含超过 900 万样本的大规模数据集，涵盖详细的语义-空间推理链，用于支持视觉生成和编辑任务。

2025-03-14，由 CUHK MMLab、HKU、SenseTime、上海人工智能实验室、清华大学和北航等机构联合创建的 Generation Chain-of-Thought (GoT) 数据集，这是一个包含超过 900 万样本的大规模数据集，涵盖详细的语义-空间推理链。这个数据集为视觉生成和编辑任务提供了强大的推理能力支持，推动了多模态大语言模型在视觉领域的应用，使生成的图像更符合人类意图。

2025-03-17 11:38:56 1158

原创 MindGYM：一个用于增强视觉-语言模型推理能力的合成数据集框架，通过生成自挑战问题来提升模型的多跳推理能力。

2025-03-13，由中山大学和阿里巴巴集团的研究团队提出了MindGYM框架，通过合成自挑战问题来增强视觉-语言模型（VLMs）的推理能力。MindGYM框架通过生成多跳推理问题和结构化课程训练，显著提升了模型在推理深度和广度上的表现，同时减少了对大规模数据和计算资源的依赖。

2025-03-14 15:49:17 920 2

原创 VLRMBench ：一个涵盖数学推理、幻觉理解、多图像理解等多种任务的视觉-语言奖励模型基准测试数据集，包含 12,634 个问题，目的全面评估 VLRMs 的推理能力。

2025-03-10，由上海交通大学和小红书公司联合创建了VLRMBench数据集。是一个专门用于评估视觉-语言奖励模型的综合性基准测试，包含12,634个问题，覆盖数学推理、幻觉理解和多图像理解三大领域。为视觉-语言奖励模型的全面评估提供了新的标准，推动了该领域的发展。

2025-03-12 17:28:54 934

原创 NAVCON：首个大规模基于认知和语言对齐的视觉语言导航预料库

2024-12-18 ，由宾夕法尼亚大学创建的 NAVCON ，这是一个大规模的视觉语言导航语料库，基于 R2R 和 RxR 数据集构建。该数据集通过标注导航指令中的核心概念，为模型提供更透明的跨模态对齐训练资源，显著提升了导航任务的可解释性和泛化能力。

2025-03-09 14:45:42 759

原创 MuBlE:为机器人操作任务规划提供了逼真的视觉观察和精确的物理建模

2025-03-05，由华为诺亚方舟实验室、捷克技术大学和帝国理工学院联合开发的MuBlE（MuJoCo and Blender simulation Environment）模拟环境和基准测试。通过结合MuJoCo物理引擎和Blender高质量渲染，为机器人操作任务规划提供了逼真的视觉观察和精确的物理建模，填补了长时域机器人操作任务模拟环境的空白，为机器人操作任务的训练和评估提供了新的工具和挑战。

2025-03-06 11:09:48 1334

原创 M-ABSA数据集：首个涵盖21种语言和7个领域的多语言平行面向方面的情感分析数据集

2025-02-14，由广东省量子工程与量子材料重点实验室、华南师范大学电子科学与技术学院（微电子学院）等研究机构合作创建的多语言面向方面的情感分析（ABSA）数据集——M-ABSA。该数据集覆盖21种语言和7个不同领域，是目前最全面的多语言平行ABSA数据集。它为多语言情感分析研究提供了丰富的资源，能够支持跨语言、跨领域的模型评估和开发，推动多语言ABSA技术的发展。

2025-03-06 10:30:31 1967

原创 DIPSER 数据集：首个面向真实场景下学生课堂参与度识别的数据集

2025-02-27 ，由西班牙阿利坎特大学计算机研究所发布的DIPSER数据集，是首个专注于真实场景下学生课堂参与度识别的数据集。该数据集的创建填补了教育技术领域在学生注意力分析方面的数据空白，为开发更精准的教育工具和提升教学质量提供了有力支持。

2025-03-05 17:43:55 2070

原创 PanAf-FGBG Dataset：首个针对野生动物行为识别背景影响的大规模数据集

2025-03-01 ,由布里斯托大学、野生黑猩猩基金会、莱比锡大学等机构创建了名为PanAf-FGBG的数据集，该数据集包含20小时的野生黑猩猩行为视频，首次提供了前景（含黑猩猩）和背景（不含黑猩猩）视频对。这一数据集的意义在于能够系统地分析背景信息对野生动物行为识别的影响，并为模型的泛化能力提供量化评估，助力野生动物保护和行为研究。

2025-03-05 17:11:37 1079

原创由麻省理工学院计算机科学与人工智能实验室等机构创建低成本、高效率的物理驱动数据生成框架，助力接触丰富的机器人操作任务

2025-02-28，由麻省理工学院计算机科学与人工智能实验室（CSAIL）和机器人与人工智能研究所的研究团队创建了一种低成本的数据生成框架，通过结合物理模拟、人类演示和基于模型的规划，高效生成大规模、高质量的接触丰富型机器人操作数据集。

2025-03-03 17:16:06 1129

原创 Collab-Overcooked:专注于多智能体协作的语言模型基准测试平台

2025-02-27，由北京邮电大学和理想汽车公司联合创建。该平台基于流行的《Overcooked-AI》游戏环境，设计了更具挑战性和实用性的交互任务，目的通过自然语言沟通促进多智能体协作。

2025-03-03 17:09:09 1311

原创 V-HOP：结合视觉和触觉多模态融合数据集，助力机器人实现鲁棒的6D物体姿态跟踪

2025-02-25，由布朗大学和德州大学达拉斯分校联合创建了V-HOP数据集，目的通过结合视觉和触觉信息实现鲁棒的6D物体姿态跟踪。该数据集的最大特点是包含了多种机械手和物体的多模态数据，能够有效支持跨机械手和跨物体的泛化能力，为机器人在复杂环境下的精准操作提供了更强大的感知支持。

2025-02-26 17:16:40 1828

原创 Para-Lane：首个真实世界多车道数据集，目的评估自动驾驶系统中的新型视角合成能力。

2025-02-22，阿里巴巴集团菜鸟自动驾驶实验室和百度研究院共同创建了一个名为 Para-Lane 的真实世界多车道数据集。该数据集目的评估自动驾驶系统中的新型视角合成（NVS）能力，通过提供大量真实世界的数据，弥补了现有合成数据集在真实性方面的不足，为自动驾驶技术的发展和仿真提供了重要支持。

2025-02-25 18:19:13 1500

Ajax工具使用

空空如也